Технические требования

Для сканирования новостных сайтов используется компьютерный алгоритм. Чтобы наша система могла определить, на каких страницах размещены статьи, убедитесь, что ваш сайт соответствует техническим требованиям, перечисленным ниже.

Требования к структуре сайта

Мы рекомендуем издателям структурировать сайты, следуя приведенным ниже правилам. Это поможет избежать ошибок при сканировании нового контента.

Постоянные адреса

Мы добавляем в Google Новости только сайты с постоянными URL основных разделов. На страницах с меняющимися адресами невозможно найти новую информацию,

поскольку нельзя определить актуальный URL. Робот Googlebot-News оптимизирован для сканирования ссылок HTML. Он не может обрабатывать ссылки на изображения, а также ссылки, встроенные в JavaScript. Убедитесь, что на страницах есть только HTML-ссылки.

Текст ссылки на статью должен совпадать с ее заголовком и названием страницы. Если по техническим причинам это невозможно, используйте сканирование только с помощью файлов Sitemap. Если вы хотите использовать другой URL источника, свяжитесь с нами.

Обеспечение доступа к контенту

В Google Новости попадает только контент, доступный поисковому роботу. Убедитесь, что каталоги, в которых размещены ваши статьи, не заблокированы файлом robots.txt. Метатеги и спецификации заголовков также не должны блокировать доступ к ссылкам на статьи. Как и в веб-поиске Google, сканирование материалов для Новостей осуществляется роботом Googlebot.

  • Если из-за файла robots.txt, метатегов или спецификаций HTML-заголовков поисковый робот не может получить доступ к контенту, узнайте, как решить проблему.

Требования к языку и кодировке

Обязательно соблюдайте наши рекомендации по выбору языка и кодировки на сайте.

Язык

В Google Новости нельзя добавлять сайты со статьями, содержащими текст на разных языках. В таких случаях мы не можем гарантировать, что публикация будет представлена на правильном языке.

Если на вашем сайте есть разделы на разных языках, например example.com/french и example.com/english, создайте для каждого языка отдельные издания. Это позволит отбирать для пользователей контент на нужном языке. Подробнее о том, как добавить издание

Кодировка

Рекомендуем выбрать кодировку UTF-8. Подробную информацию о кодировке можно найти на сайте www.w3.org.

Требования к страницам отдельных статей

Чтобы робот Google правильно индексировал новостные статьи, веб-страницы, на которых они размещаются, должны соответствовать перечисленным ниже требованиям.

URL статей

URL страниц должны быть уникальными и постоянными.

  • Каждая страница с полным текстом статьи должна иметь уникальный URL. Мы не включаем в Google Новости сайты, где нет ссылок на отдельные статьи или где для нескольких статей используется один URL.

  • Чтобы ссылки работали, у каждой статьи на вашем сайте должен быть уникальный постоянный URL. Мы не сможем работать со страницей www.vash-sait.com/novosti1.html, если ее контент ежедневно меняется.


Важно! Не публикуйте существующие материалы повторно под новыми URL.

Если позже статья будет повторно опубликована, ее URL не изменится. Например, если изначально статья находилась на странице www.example.com/news1.html, она не будет размещена по адресу www.example.com/news2.html. Если из-за перехода в новый домен или изменений в системе управления контентом вы начали использовать другой шаблон URL, отправьте нам новые правила преобразования шаблона. Мы можем помочь с изменениями в шаблоне.

Требования к макету страницы

У поискового робота должна быть возможность легко найти и распознать заголовок статьи и время ее публикации. В коде веб-страниц нужно использовать только HTML. Размещать текст статьи внутри элементов JavaScript нельзя.

Эта информация оказалась полезной?
Как можно улучшить эту статью?