Чтобы просматривать отчеты об ошибках, издателям необходимо включить свой сайт в Google Новости, создать аккаунт в Search Console и добавить в него свой ресурс. После этого выполните в Search Console следующие действия:
- Нажмите URL сайта на главной странице.
- На панели инструментов нажмите Сканирование > Ошибки сканирования.
- На вкладке Новости перечислены ошибки сканирования вашего новостного контента.
- Ошибки сканирования отсортированы по категориям, например "Получение статьи" или "Ошибка названия". Выберите категорию, чтобы просмотреть список URL и соответствующих ошибок.
Ниже перечислены ошибки, связанные с новостными статьями.
Пояснение
Текст статьи, извлеченный со страницы HTML, имеет слишком маленький размер по сравнению с другими кластерами текста без ссылок на странице. Обычно это характерно для страниц, которые содержат сводки новостей или мультимедийный контент, а не полные статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.
Рекомендации
Эта проблема часто имеет следующие причины:
- Слишком много фрагментов из похожих статей. Чтобы упростить извлечение, сделайте эти фрагменты активируемыми по клику.
- Функции с длинным описанием, например "Отправить эту статью друзьям". Попробуйте установить стиль display:none или visibility:hidden, чтобы сделать текст невидимым или динамически создавать фрагменты HTML-кода при помощи JavaScript.
- Комментарии пользователей. Комментарии можно включить в кадр iframe, динамически подгружать их при помощи AJAX или переместить на соседнюю страницу.
Пояснение
Текст статьи, извлеченный нашим роботом со страницы HTML, состоит из отдельных предложений, не объединенных в абзацы. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.
Рекомендации
- Попробуйте разбить статью на абзацы из нескольких предложений.
- Проверьте пунктуацию в предложениях.
- Убедитесь, что в абзацах не слишком часто используются теги <br> и <p>. Избегайте нецелесообразного разбиения текста.
- Удалите со страницы часть текста, не относящегося к статье.
Пояснение
Текст статьи, извлеченный нашим роботом со страницы HTML, слишком длинный для новостной статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста. Это часто происходит с новостями, которые содержат вносимые пользователями комментарии после статьи, и с макетами HTML, содержащими другие материалы, помимо новостной статьи.
Рекомендации
Удалите со страницы часть текста, не относящегося к статье. Если на странице есть комментарии пользователей, выполните одно из следующих действий:
- Включите их в кадр iframe.
- Используйте динамическую подгрузку с помощью AJAX.
- Переместите часть комментариев на соседнюю страницу.
Пояснение
В тексте статьи слишком мало слов для новостной публикации. Обычно это характерно для страниц, которые содержат сводки новостей или мультимедийный контент, а не полные статьи. Мы предусмотрели такую ошибку, чтобы избежать включения неправильных фрагментов текста.
Рекомендации
- Отформатируйте статьи, разделив текст на абзацы, состоящие из нескольких предложений. Если статья слишком короткая, она не будет включена.
- В статье должно быть более 80 слов.
Пояснение
Google не удалось определить дату публикации статьи.
Рекомендации
- В отдельную строку HTML-кода, между заголовком статьи и самим текстом, поместите точную дату и время первой публикации статьи.
- Удалите любые другие даты из HTML-кода страницы со статьей, чтобы избежать ошибки при определении даты публикации поисковым роботом.
- Если требуется использовать метатег даты, сперва сообщите нам об этом. Он должен иметь следующий вид: <meta name="DC.date.issued" content="ГГГГ-ММ-DДД">. Дата указывается в формате W3C – полная дата (ГГГГ-ММ-ДД) или полная дата и время (ГГГГ-ММ-ДДTчч:мм:ссСЧП) с суффиксом часового пояса (СЧП).
- Создайте файл Sitemap для Google Новостей. Тег <publication_date> позволит Google правильно определить дату публикации статьи.
Пояснение
Дата этой статьи, обнаруженная в теге <publication_date> в файле Sitemap или непосредственно на HTML-странице, слишком давняя.
Рекомендации
- Статья должна быть опубликована не более двух дней назад. В настоящее время собираются только статьи, опубликованные в течение последних 2 дней.
- Следуйте приведенным выше рекомендациям по форматированию даты.
Пояснение
Со страницы HTML извлечен пустой текст статьи.
Рекомендации
- Убедитесь, что полный текст вашей статьи есть в исходном коде страниц статьи (а не встроен, например, в файл JavaScript или в кадр iframe).
- Убедитесь, что в исходном коде статей не используется стиль, например display:none или visibility:hidden.
- Убедитесь, что ссылки на статьи ведут непосредственно на страницы статей, а не на промежуточную страницу с функцией переадресации JavaScript.
Пояснение
Не удалось извлечь заголовок статьи со страницы. Такое бывает, если мы не можем обнаружить действительный заголовок, саму статью или ее временную метку. Мы приводим URL с этой ошибкой, чтобы предоставить вам информацию о том, почему некоторые статьи не отображаются в Google Новостях.
Рекомендации
- Убедитесь, что название, текст и временная метка статей доступны для сканирования (присутствуют в виде текста, а не как изображения). В настоящий момент эта ошибка выводится преимущественно для справки. Мы активно работаем над улучшением способов извлечения контента, чтобы эта ошибка появлялась как можно реже.
- Отправьте файл Sitemap для Google Новостей.
Пояснение
Текст статьи, извлеченный со страницы HTML, не содержит словосочетаний со знаками препинания. Эта ошибка была создана, чтобы избежать включения неправильного фрагмента текста.
Рекомендации
- Если статья не содержит словосочетаний со знаками препинания, ее не удастся включить в Google Новости. Убедитесь, что текст статей состоит из предложений и что теги <br> и <p> в абзацах используются не слишком часто.
- Полный текст каждой статьи должен быть доступен в исходном коде соответствующих страниц (а не встроен, например, в файл JavaScript).
- Убедитесь, что ссылки на статьи ведут непосредственно на страницы статей, а не на промежуточную страницу с функцией переадресации JavaScript.
Пояснение
Страница раздела или статьи выполняет переадресацию на URL в другом домене.
Рекомендации
- Все страницы раздела и статьи должны находиться в домене сайта, включенного в Google Новости.
- Если вы не используете внешние переадресации, убедитесь, что никто посторонний не изменял ваш сайт. Подробнее о взломанных сайтах…
Пояснение
Превышен максимально допустимый размер раздела или страницы статьи.
Рекомендации
Максимально допустимый размер исходной страницы HTML – 256 КБ.
Пояснение
Заголовок, извлеченный со страницы HTML, заставляет предполагать, что это не новостная статья.
Рекомендации
Часто эту проблему можно решить, включив название статьи в тег <title> страницы и сделав это название заметным для читателей, например с помощью тега <h1>. Подробнее...
Пояснение
Не удалось извлечь заголовок статьи со страницы HTML.
Рекомендации
- Следуйте рекомендациям Google по форматированию названий.
- Чтобы обеспечить удобство чтения статей на мобильных устройствах, не включайте начальные цифры (иногда это код доступа) в текст ссылки заголовка.
Пояснение
Робот Googlebot-News определил, что страница сжата, но не смог ее распаковать. Это может быть вызвано плохим состоянием сети, а также неправильным программированием или конфигурацией веб-сервера.
Рекомендации
Проверьте сеть или веб-сервер.
Пояснение
Тип содержания HTTP этой страницы не поддерживается Google Новостями.
Рекомендации
Для статей тег content-type должен иметь значение text/html, text/plain или application/xhtml+xml.