เมื่อตั้งค่าไฟล์ app-ads.txt ในโดเมนนักพัฒนาซอฟต์แวร์แล้ว Crawler ของ Google จะดำเนินการต่อไปนี้
- พยายามทำการ Crawl ไฟล์
- แยกวิเคราะห์เนื้อหาของไฟล์เพื่อระบุรหัสผู้ขายที่ได้รับอนุญาตให้สร้างรายได้จากพื้นที่โฆษณาของคุณ
หากต้องการตรวจสอบว่าทำการ Crawl ข้อมูลไฟล์ app-ads.txt ได้ เราแนะนำให้คุณปฏิบัติตามขั้นตอนการแก้ปัญหาต่อไปนี้
- ยืนยันว่าไฟล์พร้อมใช้งาน
- ยืนยันว่าเข้าถึงไฟล์ได้จากโดเมนราก
- ตรวจสอบว่า robots.txt อนุญาตให้ทำการ Crawl
- ตรวจสอบว่าไฟล์ส่งคืนมาพร้อมรหัสสถานะ HTTP 200 OK
- ตรวจสอบว่าไม่มีข้อผิดพลาดในการจัดรูปแบบหรืออักขระที่ไม่ถูกต้องในไฟล์
- ทำให้ไฟล์ app-ads.txt เข้าถึงได้ทั้งทาง HTTP และ HTTPS
ยืนยันว่าไฟล์พร้อมใช้งาน
หากไฟล์ app-ads.txt ที่เห็นก่อนหน้านี้ไม่พร้อมใช้งานในการรวบรวมข้อมูลครั้งต่อไป รายการที่เห็นก่อนหน้านี้จะถูกดำเนินการดังนี้
- ลบถาวรหากการตอบกลับเป็นข้อผิดพลาด Hard 404 (หน้าเว็บที่ไม่มีอยู่จริง หรือสถานะ HTTP 404)
- คงอยู่นานถึง 5 วันถ้าการตอบสนองเป็นข้อผิดพลาด Soft 404 (หน้าที่มีอยู่จริงที่ส่งคืนสำหรับ URL ที่ไม่มีอยู่จริง หรือสถานะ HTTP 200) หรือข้อผิดพลาดเกี่ยวกับเซิร์ฟเวอร์ 500
ยืนยันว่าเข้าถึงไฟล์ได้จากโดเมนราก
การเปลี่ยนเส้นทางจาก domain.com/app-ads.txt
เป็น www.domain.com/app-ads.txt
ค่อนข้างเป็นเรื่องธรรมดา การรวบรวมข้อมูล app-ads.txt จะเริ่มต้นที่โดเมนราก ซึ่งต้องส่งคืนมาจากหรือเปลี่ยนเส้นทางไปยังไฟล์ app-ads.txt
www.domain.com/app-ads.txt
ได้ก็ต่อเมื่อ domain.com/app-ads.txt
เปลี่ยนเส้นทางไปยังไฟล์นั้นตรวจสอบว่า robots.txt อนุญาตให้รวบรวมข้อมูล
โปรแกรมรวบรวมข้อมูลอาจละเว้นไฟล์ app-ads.txt หากไฟล์ robots.txt จํากัดการรวบรวมข้อมูล หาก URL ของ app-ads.txt เปลี่ยนเส้นทางไปยังชื่อโฮสต์อื่น โปรดทราบว่าไฟล์ robots.txt ในชื่อโฮสต์ที่ตามมาอาจส่งผลต่อโปรแกรมรวบรวมข้อมูลด้วยเช่นกัน
อัปเดตไฟล์ robots.txt เพื่ออนุญาตให้ Google ทำการ Crawl ไฟล์ app-ads.txt
เพิ่มข้อความสองบรรทัดต่อไปนี้ลงในไฟล์ robots.txt ของคุณ
User-agent: Google-adstxt
Disallow:
Google-adstxt
Crawler จะปฏิบัติตามบันทึก Mediapartners-Google
และ Googlebot
robots.txt User-agent
ด้วยเช่นกันตรวจสอบว่าไฟล์ส่งคืนมาพร้อมรหัสสถานะ HTTP 200 OK
แม้ว่าคำขอไฟล์ app-ads.txt อาจส่งคืนเนื้อหาของไฟล์ในเนื้อหาของการตอบสนอง หากรหัสสถานะในส่วนหัวของการตอบสนองระบุว่าไม่พบไฟล์ (เช่น รหัสสถานะ 404) จะเกิดสิ่งต่อไปนี้
- การตอบสนองจะถูกเพิกเฉย
- ไฟล์นี้จะถือว่าไม่มีอยู่จริง
ตรวจสอบว่าไฟล์มีรหัสสถานะ HTTP 200 OK
ตรวจสอบว่าไม่มีข้อผิดพลาดในการจัดรูปแบบหรืออักขระที่ไม่ถูกต้องในไฟล์
ข้อผิดพลาดในการจัดรูปแบบ เช่น ช่องว่างที่ไม่ถูกต้อง อาจตรวจพบได้ยาก แต่ก็ทำให้ Crawler แยกวิเคราะห์ไฟล์ app-ads.txt ได้ยากและอาจทำให้ไฟล์ถูกเพิกเฉย
หลีกเลี่ยงการคัดลอกและวางรายการ app-ads.txt จากเครื่องมือแก้ไข Rich Text เราแนะนำให้ใช้เครื่องมือแก้ไขข้อความธรรมดา และคุณยังตรวจหาอักขระ UTF-8 ที่ไม่ถูกต้องในไฟล์ app-ads.txt ได้โดยใช้โปรแกรมแก้ไข HEX
ทำให้ไฟล์ app-ads.txt เข้าถึงได้ทั้งทาง HTTP และ HTTPS
Crawler ของ Google จะพยายามทำการ Crawl ข้อมูลไฟล์ app-ads.txt ทั้งหมดใน HTTP และ HTTPS อย่างไรก็ตาม การตอบกลับ 404 (หรือ 40X) ทำให้รายการที่ได้รับการ Crawl ก่อนหน้านี้ถูกลบถาวร แม้ว่าจะได้รับการ Crawl ข้อมูลไฟล์ app-ads.txt ผ่านทาง HTTP ก็ตาม ดังนั้นหากการ Crawl ผ่าน HTTPS แสดงผล 404 (หรือ 40X) จะเกิดสิ่งต่อไปนี้ขึ้น
- รายการที่ได้รับการ Crawl ข้อมูลก่อนหน้านี้จะถูกลบถาวร
โปรดตรวจสอบว่า app-ads.txt เข้าถึงได้ทั้งทาง HTTP และ HTTPS