Google ใช้อัลกอริทึมของคอมพิวเตอร์เพื่อรวบรวมข้อมูลในเว็บไซต์ข่าวสาร เว็บไซต์ควรเป็นไปตามหลักเกณฑ์ทางเทคนิคเพื่อช่วยให้ระบบของเราระบุหน้าเว็บที่เป็นบทความได้
ข้อกำหนดสำหรับโครงสร้างเว็บไซต์
Google News แนะนำให้ผู้เผยแพร่เนื้อหาปฏิบัติตามหลักเกณฑ์ด้านโครงสร้างของเว็บไซต์ด้านล่าง เพื่อให้ระบบเข้ารวบรวมข้อมูลเนื้อหาใหม่ได้อย่างถูกต้อง
หน้าหัวข้อถาวร
Google News อาจไม่เข้าใจเว็บไซต์ของคุณหาก URL หัวข้อข่าวสารหลักมีการเปลี่ยนแปลงบ่อย URL ที่มีการเปลี่ยนแปลงจะทำให้เรารวบรวมข้อมูลเนื้อหาใหม่ไม่ได้เพราะระบบตรวจหา URL ล่าสุดที่จะรวบรวมข้อมูลไม่ได้
Googlebot-News ซึ่งเป็นโปรแกรมรวบรวมข้อมูลอัตโนมัติจะทำงานได้อย่างมีประสิทธิภาพมากที่สุดเมื่อ URL ของหัวข้อข่าวสารหลักของคุณไม่มีการเปลี่ยนแปลง Googlebot-News จะรวบรวมข้อมูลลิงก์ HTML ได้ดีที่สุด และจะรวบรวมข้อมูลลิงก์รูปภาพหรือลิงก์ที่ฝังใน JavaScript ไม่ได้ ตรวจสอบว่าบทความในหน้าหัวข้อของคุณมีเฉพาะลิงก์ HTML เท่านั้น
นอกจากนี้ อย่าลืมตรวจสอบว่า anchor text ที่ชี้ไปยังบทความในหน้าหัวข้อนั้นตรงกับชื่อบทความและหน้าเว็บ ถ้าข้อกำหนดด้านเทคนิคเหล่านี้เป็นปัญหาสำหรับคุณ การรวบรวมข้อมูลเฉพาะแผนผังเว็บไซต์อาจเป็นทางออกที่เหมาะสม หากต้องการให้เราลองรวบรวมข้อมูลเว็บไซต์ของคุณโดยใช้แผนผังเว็บไซต์อย่างเดียว โปรดติดต่อทีมของเรา
เนื้อหาที่เข้าถึงได้
โปรแกรมรวบรวมข้อมูลของเราจำเป็นต้องเข้าถึงเว็บไซต์ของคุณเพื่อรวมเนื้อหาไว้ใน Google News โปรดตรวจสอบว่าไฟล์ robots.txt ไม่บล็อกไดเรกทอรีซึ่งโฮสต์บทความของคุณ และเมตาแท็กหรือการกำหนดส่วนหัวไม่บล็อกการเข้าถึงลิงก์บทความ Google News รวบรวมข้อมูลด้วยโรบ็อตชนิดเดียวกับที่ Google ค้นเว็บใช้ ซึ่งก็คือ Googlebot
-
อ่านจัดการการเข้าถึงเนื้อหาในเว็บไซต์ หากคุณเชื่อว่าไฟล์ robots.txt, เมตาแท็ก หรือการกำหนดส่วนหัว HTML ของเว็บไซต์อาจกำลังบล็อกไม่ให้โปรแกรมรวบรวมข้อมูลเข้าถึงเนื้อหาของคุณ
ข้อกำหนดสำหรับภาษาและการเข้ารหัส
โปรดทำความเข้าใจหลักเกณฑ์สำหรับภาษาของเนื้อหาและการเข้ารหัสเว็บไซต์
ภาษา
Google News จะไม่แสดงเว็บไซต์ที่มีบทความที่แสดงหลายภาษาในบทความเดียว ระบบของเรามีปัญหาในการวิเคราะห์เนื้อหาที่มีหลายภาษา ซึ่งทำให้เป็นการยากที่จะมั่นใจได้ว่าเราแสดงเนื้อหาในภาษาที่ถูกต้อง
หากเว็บไซต์ของคุณมีหัวข้อเฉพาะภาษา เช่น example.com/french และ example.com/english ให้สร้างการเผยแพร่เนื้อหาแยกกันสำหรับแต่ละภาษา ซึ่งจะช่วยให้ผู้ใช้ได้เห็นเนื้อหาที่แสดงในภาษาของผู้ใช้ได้ ดูวิธีตั้งค่าการเผยแพร่เนื้อหา
เข้ารหัสเว็บไซต์ของคุณ
เพื่อผลลัพธ์ที่ดีที่สุด โปรดเข้ารหัสเว็บไซต์เป็นแบบ UTF-8 ดูข้อมูลเพิ่มเติมเกี่ยวกับการเข้ารหัสได้ที่ www.w3.org
ข้อกำหนดสำหรับหน้าบทความแต่ละหน้า
เพื่อให้เรารวบรวมข้อมูลเฉพาะบทความข่าวของคุณ Google News มีข้อกำหนดหลายข้อสำหรับหน้าบทความแต่ละหน้า ทำตามขั้นตอนด้านล่างเพื่อให้แน่ใจว่าคุณปฏิบัติตามหลักเกณฑ์
URL ของบทความ
URL ของบทความต้องไม่ซ้ำกันและเป็นแบบถาวร
-
URL ที่ไม่ซ้ำกัน: แต่ละหน้าที่แสดงข้อความแบบเต็มของบทความจะต้องมี URL ที่ไม่ซ้ำกัน เราจะแสดงเว็บไซต์ใน Google News ไม่ได้หากเว็บไซต์นั้นแสดงหลายบทความใน URL เดียวกัน หรือไม่มีลิงก์ไปยังหน้าสำหรับแต่ละบทความโดยเฉพาะ
- URL แบบถาวร: เพื่อให้ลิงก์ไปยังบทความใช้งานได้ แต่ละบทความในเว็บไซต์ข่าวของคุณจะต้องเชื่อมโยงกับ URL ที่เป็นแบบถาวรและไม่ซ้ำกับของบทความอื่น ตัวอย่างเช่น เราจะรวบรวมข้อมูลในหน้าเว็บ www.yoursite.com/news1.html ไม่ได้หากหน้านี้แสดงเรื่องราวที่ไม่เหมือนกันในแต่ละวัน
สำคัญ: อย่าเผยแพร่บทความซ้ำโดยใช้ URL ใหม่
หากมีการเผยแพร่บทความซ้ำในภายหลัง URL ของบทความนั้นจะไม่เปลี่ยน เช่น หากเผยแพร่บทความเป็นครั้งแรกภายใต้ www.example.com/news1.html การเผยแพร่บทความนั้นซ้ำจะไม่ใช้ www.example.com/news2.html ในระหว่างขั้นตอนการเปลี่ยนโดเมนหรือโครงสร้างระบบจัดการเนื้อหา (CMS) ถ้ารูปแบบ URL เปลี่ยน ให้ส่งกฎการเปลี่ยนรูปแบบมาให้เรา เพื่อรับความช่วยเหลือในการเปลี่ยนรูปแบบเหล่านี้
หลักเกณฑ์ของรูปแบบการจัดหน้า
ตรวจสอบว่าพาดหัวและเวลาการเผยแพร่บทความจะรับการระบุจากโปรแกรมรวบรวมข้อมูลอัตโนมัติของเราได้โดยง่าย หน้าบทความของคุณควรใช้รูปแบบ HTML และเนื้อความไม่ได้ฝังอยู่ใน JavaScript