Технические требования

Для сканирования новостных сайтов используется компьютерный алгоритм. Чтобы наша система могла определить, на каких страницах размещены статьи, убедитесь, что ваш сайт соответствует техническим требованиям, перечисленным ниже.

Требования к структуре сайта

Мы рекомендуем издателям структурировать сайты, следуя приведенным ниже правилам. Это поможет избежать ошибок при сканировании нового контента.

Постоянные адреса

Мы добавляем в Google Новости только сайты с постоянными URL основных разделов. На страницах с меняющимися адресами невозможно найти новую информацию,

поскольку нельзя определить актуальный URL. Робот Googlebot-News оптимизирован для сканирования ссылок HTML. Он не может обрабатывать ссылки на изображения, а также ссылки, встроенные в JavaScript. Убедитесь, что на страницах есть только HTML-ссылки.

Текст ссылки на статью должен совпадать с ее заголовком и названием страницы. Если по техническим причинам это невозможно, используйте сканирование только с помощью файлов Sitemap. Если вы хотите использовать другой URL источника, свяжитесь с нами.

Обеспечение доступа к контенту

В Google Новости попадает только контент, доступный поисковому роботу. Убедитесь, что каталоги, в которых размещены ваши статьи, не заблокированы файлом robots.txt. Метатеги и спецификации заголовков также не должны блокировать доступ к ссылкам на статьи. Как и в веб-поиске Google, сканирование материалов для Новостей осуществляется роботом Googlebot.

  • Если из-за файла robots.txt, метатегов или спецификаций HTML-заголовков поисковый робот не может получить доступ к контенту, узнайте, как решить проблему.

Требования к языку и кодировке

Обязательно соблюдайте наши рекомендации по выбору языка и кодировки на сайте.

Язык

В Google Новости нельзя добавлять сайты со статьями, содержащими текст на разных языках. В таких случаях мы не можем гарантировать, что публикация будет представлена на правильном языке.

Если на вашем сайте есть разделы на разных языках, например example.com/french и example.com/english, создайте для каждого языка отдельные издания. Это позволит отбирать для пользователей контент на нужном языке. Подробнее о том, как добавить издание

Кодировка

Рекомендуем выбрать кодировку UTF-8. Подробную информацию о кодировке можно найти на сайте www.w3.org.

Требования к страницам отдельных статей

Чтобы робот Google правильно индексировал новостные статьи, веб-страницы, на которых они размещаются, должны соответствовать перечисленным ниже требованиям.

URL статей

URL страниц должны быть уникальными и постоянными.

  • Каждая страница с полным текстом статьи должна иметь уникальный URL. Мы не включаем в Google Новости сайты, где нет ссылок на отдельные статьи или где для нескольких статей используется один URL.

  • Чтобы ссылки работали, у каждой статьи на вашем сайте должен быть постоянный URL. Мы не сможем работать со страницей www.vash-sait.com/novosti1.html, если ее контент ежедневно меняется.

Требования к макету страницы

У поискового робота должна быть возможность легко найти и распознать заголовок статьи и время ее публикации. В коде веб-страниц нужно использовать только HTML. Размещать текст статьи внутри элементов JavaScript нельзя.

Эта информация оказалась полезной?
Как можно улучшить эту статью?