Ошибки сканирования новостных статей

Обратите внимание! Индекс новостей создается автоматически. Мы стараемся сканировать как можно больше материалов, но не можем гарантировать, что в него попадут абсолютно все ваши статьи.

Чтобы просматривать отчеты об ошибках, издателям необходимо включить свой сайт в Google Новости, создать аккаунт в Search Console и добавить в него свой ресурс. После этого выполните в Search Console следующие действия:

  • Нажмите URL сайта на главной странице.
  • На панели инструментов нажмите Сканирование > Ошибки сканирования.
  • На вкладке Новости перечислены ошибки сканирования вашего новостного контента.
  • Ошибки сканирования отсортированы по категориям, например "Получение статьи" или "Ошибка названия". Выберите категорию, чтобы просмотреть список URL и соответствующих ошибок.

Ниже перечислены ошибки, связанные с новостными статьями.

Статья непропорционально короткая

Пояснение

Текст статьи, извлеченный со страницы HTML, имеет слишком маленький размер по сравнению с другими кластерами текста без ссылок на странице. Обычно это характерно для страниц, которые содержат сводки новостей или мультимедийный контент, а не полные статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.

Рекомендации

Эта проблема часто имеет следующие причины:

  • Слишком много фрагментов из похожих статей. Чтобы упростить извлечение, сделайте эти фрагменты активируемыми по клику.
  • Функции с длинным описанием, например "Отправить эту статью друзьям". Попробуйте установить стиль display:none или visibility:hidden, чтобы сделать текст невидимым или динамически создавать фрагменты HTML-кода при помощи JavaScript.
  • Комментарии пользователей. Комментарии можно включить в кадр iframe, динамически подгружать их при помощи AJAX или переместить на соседнюю страницу.
Статья фрагментирована

Пояснение

Текст статьи, извлеченный нашим роботом со страницы HTML, состоит из отдельных предложений, не объединенных в абзацы. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.

Рекомендации

  • Попробуйте разбить статью на абзацы из нескольких предложений.
  • Проверьте пунктуацию в предложениях.
  • Убедитесь, что в абзацах не слишком часто используются теги <br> и <p>. Избегайте нецелесообразного разбиения текста.
  • Удалите со страницы часть текста, не относящегося к статье.
Статья слишком длинная

Пояснение

Текст статьи, извлеченный нашим роботом со страницы HTML, слишком длинный для новостной статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста. Это часто происходит с новостями, которые содержат вносимые пользователями комментарии после статьи, и с макетами HTML, содержащими другие материалы, помимо новостной статьи.

Рекомендации

Удалите со страницы часть текста, не относящегося к статье. Если на странице есть комментарии пользователей, выполните одно из следующих действий:

  • Включите их в кадр iframe.
  • Используйте динамическую подгрузку с помощью AJAX.
  • Переместите часть комментариев на соседнюю страницу.
Статья слишком короткая

Пояснение

В тексте статьи слишком мало слов для новостной публикации. Обычно это характерно для страниц, которые содержат сводки новостей или мультимедийный контент, а не полные статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.

Рекомендации

  • Отформатируйте статьи, разделив текст на абзацы, состоящие из нескольких предложений. Если статья слишком короткая, она не будет включена.
  • В статье должно быть более 80 слов.
Дата не найдена

Пояснение

Google не удалось определить дату публикации статьи.

Рекомендации

 

  • В отдельную строку HTML-кода, между заголовком статьи и самим текстом, поместите точную дату и время первой публикации статьи.
  • Удалите любые другие даты из HTML-кода страницы со статьей, чтобы избежать ошибки при определении даты публикации поисковым роботом.
  • Если требуется использовать метатег даты, сперва сообщите нам об этом. Он должен иметь следующий вид: <meta name="DC.date.issued" content="ГГГГ-ММ-DДД">. Дата указывается в формате W3C – полная дата (ГГГГ-ММ-ДД) или полная дата и время (ГГГГ-ММ-ДДTчч:мм:ссСЧП) с суффиксом часового пояса (СЧП).
  • Создайте файл Sitemap для Google Новостей. Тег <publication_date> позволит Google правильно определить дату публикации статьи.
Дата слишком давняя

Пояснение

Дата этой статьи, обнаруженная в теге <publication_date> в файле Sitemap или непосредственно на HTML-странице, слишком давняя.

Рекомендации

  • Статья должна быть опубликована не более двух дней назад. В настоящее время собираются только статьи, опубликованные в течение последних 2 дней.
  • Следуйте приведенным выше рекомендациям по форматированию даты.
Пустая статья

Пояснение

Со страницы HTML извлечен пустой текст статьи.

Рекомендации

  • Убедитесь, что полный текст вашей статьи есть в исходном коде страниц статьи (а не встроен, например, в файл JavaScript или в кадр iframe).
  • Убедитесь, что в исходном коде статей не используется стиль, например display:none или visibility:hidden.
  • Убедитесь, что ссылки на статьи ведут непосредственно на страницы статей, а не на промежуточную страницу с функцией переадресации JavaScript.
Ошибка при извлечении

Пояснение

Не удалось извлечь заголовок статьи со страницы. Такое бывает, если мы не можем обнаружить действительный заголовок, саму статью или ее временную метку. Мы приводим URL с этой ошибкой, чтобы предоставить вам информацию о том, почему некоторые статьи не отображаются в Google Новостях.

Рекомендации

  • Убедитесь, что название, текст и временная метка статей доступны для сканирования (присутствуют в виде текста, а не как изображения). В настоящий момент эта ошибка выводится преимущественно для справки. Мы активно работаем над улучшением способов извлечения контента, чтобы эта ошибка появлялась как можно реже.
  • Отправьте файл Sitemap для Google Новостей.
Не найдено ни одного предложения

Пояснение

Текст статьи, извлеченный со страницы HTML, не содержит словосочетаний со знаками препинания. Эта ошибка была создана, чтобы избежать включения неправильного фрагмента текста.

Рекомендации

  • Если статья не содержит словосочетаний со знаками препинания, ее не удастся включить в Google Новости. Убедитесь, что текст статей состоит из предложений и что теги <br> и <p> в абзацах используются не слишком часто.
  • Полный текст каждой статьи должен быть доступен в исходном коде соответствующих страниц (а не встроен, например, в файл JavaScript).
  • Убедитесь, что ссылки на статьи ведут непосредственно на страницы статей, а не на промежуточную страницу с функцией переадресации JavaScript.
Внешняя переадресация

Пояснение

Страница раздела или статьи выполняет переадресацию на URL в другом домене.

Рекомендации

  • Все страницы раздела и статьи должны находиться в домене сайта, включенного в Google Новости.
  • Если вы не используете внешние переадресации, убедитесь, что никто посторонний не изменял ваш сайт. Подробнее о взломанных сайтах
Страница слишком велика

Пояснение

Превышен максимально допустимый размер раздела или страницы статьи.

Рекомендации

Максимально допустимый размер исходной страницы HTML – 256 КБ.

Недопустимый заголовок

Пояснение

Заголовок, извлеченный со страницы HTML, заставляет предполагать, что это не новостная статья.

Рекомендации

Часто эту проблему можно решить, включив название статьи в тег <title> страницы и сделав это название заметным для читателей, например с помощью тега <h1>. Подробнее...

Заголовок не найден

Пояснение

Не удалось извлечь заголовок статьи со страницы HTML.

Рекомендации

Не удалось распаковать

Пояснение

Робот Googlebot-News определил, что страница сжата, но не смог ее распаковать. Это может быть вызвано плохим состоянием сети, а также неправильным программированием или конфигурацией веб-сервера.

Рекомендации

Проверьте сеть или веб-сервер.

Неподдерживаемый тип содержания

Пояснение

Тип содержания HTTP этой страницы не поддерживается Google Новостями.

Рекомендации

Для статей тег content-type должен иметь значение text/html, text/plain или application/xhtml+xml.

Эта информация оказалась полезной?

Как можно улучшить эту статью?
true
Не знакомы с Search Console?

Ещё не пользовались Search Console? Этот сервис пригодится вам, если вы специалист по поисковой оптимизации, разработчик сайтов или только начали изучать веб-технологии. Начните знакомство с Search Console отсюда.

Поиск
Очистить поле поиска
Закрыть поиск
Главное меню
5631221017469759240
true
Поиск по Справочному центру
true
true
true
true
true
83844
false
false