Google menggunakan algoritme komputer untuk meng-crawl situs berita. Untuk membantu sistem kami mengetahui halaman web yang merupakan artikel, pastikan situs Anda mengikuti pedoman teknis ini.
Persyaratan untuk struktur situs
Google Berita menyarankan penerbit untuk mengikuti pedoman struktur situs di bawah ini agar konten baru dapat di-crawl dengan benar.
Halaman rubrik permanen
Jika URL di rubrik berita utama Anda sering berubah, Google Berita mungkin tidak dapat memahami situs Anda. URL yang tidak permanen mencegah kami meng-crawl konten baru karena kami tidak dapat mendeteksi URL terbaru untuk di-crawl.
Crawler otomatis kami, Googlebot-News, akan bekerja paling efektif jika URL rubrik berita utama Anda tidak berubah. Googlebot-News paling sesuai untuk meng-crawl link HTML. Namun, link gambar atau link yang disematkan dalam JavaScript tidak dapat di-crawl. Pastikan artikel Anda di halaman rubrik hanya memiliki link HTML.
Selain itu, pastikan teks link yang mengarah ke artikel di halaman rubrik Anda cocok dengan judul artikel dan judul halaman. Jika Anda kesulitan memenuhi persyaratan teknis ini, crawl khusus peta situs mungkin merupakan solusinya. Jika Anda ingin mencoba melakukan crawling situs secara eksklusif berdasarkan peta situs, hubungi tim kami.
Konten yang dapat diakses
Crawler kami perlu mengakses situs Anda untuk menyertakan konten Anda di Google Berita. Pastikan direktori yang menghosting artikel Anda tidak diblokir oleh file robots.txt, dan metatag atau spesifikasi header tidak memblokir akses ke link artikel Anda. Google Berita meng-crawl dengan robot yang sama seperti Google Penelusuran Web, Googlebot.
-
Baca mengelola akses ke konten di situs Anda jika Anda yakin file robots.txt, metatag, atau spesifikasi header HTML situs Anda mungkin memblokir crawler kami sehingga tidak dapat mengakses konten Anda.
Persyaratan untuk bahasa dan encoding
Penting untuk memahami pedoman kami terkait bahasa konten dan encoding situs Anda.
Bahasa
Google Berita tidak menampilkan situs dengan artikel yang menampilkan beberapa bahasa dalam satu artikel. Sistem kami mengalami masalah dalam menganalisis konten yang berisi beberapa bahasa sehingga sulit memastikan bahwa kami menampilkan konten dalam bahasa yang benar.
Jika situs Anda memiliki rubrik dengan bahasa tertentu, seperti example.com/french dan example.com/english, buat publikasi terpisah untuk setiap bahasa. Tindakan ini akan memastikan pengguna mendapatkan konten dalam bahasa mereka. Pelajari cara menyiapkan publikasi.
Mengenkode situs
Untuk hasil terbaik, enkode situs Anda dalam format UTF-8. Untuk informasi selengkapnya tentang encoding, buka www.w3.org.
Persyaratan untuk setiap halaman artikel
Untuk memastikan kami hanya meng-crawl artikel berita Anda, Google Berita memiliki beberapa persyaratan untuk setiap halaman artikel. Ikuti langkah-langkah di bawah ini untuk memastikan bahwa Anda mematuhi pedoman Google Berita.
URL Artikel
URL artikel Anda bersifat unik dan permanen:
-
URL unik: Setiap halaman yang menampilkan teks lengkap artikel harus memiliki URL yang unik. Kami tidak dapat menyertakan situs di Google Berita yang menampilkan beberapa artikel dalam satu URL, atau yang tidak memiliki link ke halaman khusus untuk setiap artikel.
- URL permanen: Untuk memastikan link ke artikel berfungsi, setiap artikel di situs berita Anda harus dikaitkan dengan URL permanen yang unik untuk setiap artikel. Misalnya, kami tidak akan dapat meng-crawl halaman www.yoursite.com/news1.html jika halaman tersebut menampilkan artikel berbeda setiap hari.
Penting: Jangan publikasikan ulang artikel dengan URL baru.
Jika artikel dipublikasikan ulang di kemudian hari, URL artikel tersebut tidak akan berubah. Misalnya, jika artikel awalnya dipublikasikan di www.example.com/news1.html, artikel tersebut tidak dipublikasikan ulang di www.example.com/news2.html. Jika dalam proses perubahan domain atau struktur Sistem Pengelolaan Konten (CMS) pola URL Anda berubah, kirimi kami aturan transformasi pola Anda. Kami dapat memberikan bantuan terkait perubahan pola ini.
Pedoman tata letak halaman
Pastikan judul artikel dan waktu publikasi Anda mudah diidentifikasi oleh crawler otomatis kami. Halaman artikel Anda harus menggunakan format HTML dan teks isinya tidak disematkan di JavaScript.