Настройте файлы Sitemap

Отчет о файлах Sitemap

С помощью отчета о файлах Sitemap вы можете сообщить Google о появлении новых карт вашего сайта, посмотреть историю отправки файлов Sitemap, а также узнать об ошибках, с которыми столкнулась наша система при анализе файла Sitemap.

ОТКРЫТЬ ОТЧЕТ О ФАЙЛАХ SITEMAP

Что такое файл Sitemap? Будет ли мне полезен этот отчет?

Файл Sitemap содержит информацию о страницах сайта, на котором он размещен. По этому файлу Google определяет, какие страницы нужно просканировать.

  • Если вы пользуетесь сервисом веб-хостинга (Squarespace, Wix и т. п.), вероятно, файл Sitemap создается для вас автоматически. В таком случае не требуется ни создавать его вручную, ни прибегать к помощи отчета, о котором идет речь. Поищите сведения о файлах Sitemap в справочных материалах своего хостинг-провайдера.
  • Если у вас небольшой сайт (меньше 100 страниц) и если по ссылкам можно перейти от главной страницы к любой другой на этом сайте, то файлы Sitemap и отчет о них вам не нужны. Достаточно запросить индексирование главной страницы. При использовании сервиса веб-хостинга, как уже было сказано выше, никакие действия не требуются.

Подробнее о файлах Sitemap

Управление файлами Sitemap

Sitemaps API
Для управления файлами Sitemap можно использовать Search Console Sitemaps API. Этот API поддерживает те же функции и позволяет получать ту же информацию, что и отчет.

Как отправить файл Sitemap

"Отправить" файл Sitemap в Google значит сообщить нам, где найти его на вашем сайте. Сам файл в Google не загружается.

Следуйте приведенным ниже инструкциям.

  1. Требования:
    • Вы сможете отправить файл Sitemap с помощью отчета, только если у вас есть права владельца ресурса. Если таких прав у вас нет, разместите ссылку на файл Sitemap в файле robots.txt.
    • Обратите внимание, что в отчете будет показываться максимум 1000 отправленных файлов Sitemap (причем не в хронологическом порядке), даже если вы добавите файлы сверх этого количества. Сейчас в Search Console нет возможности посмотреть файлы Sitemap, не вошедшие в первую тысячу.
  2. Опубликуйте файл Sitemap на своем сайте.
    • Файл должен быть создан в одном из подходящих форматов. Придерживайтесь рекомендаций относительно синтаксиса, расположения файла и т. д.
    • Советуем разместить файл Sitemap на корневом уровне вашего сайта. Если же вы используете сервис веб-хостинга (например, Blogger, Wix или GoDaddy), изучите справочные материалы этого сервиса, чтобы узнать, куда и как добавить файл и есть ли в нем необходимость.
    • Файл Sitemap должен быть доступен роботу Googlebot. Чтобы проверить, так ли это, попробуйте перейти по URL файла Sitemap в режиме инкогнито.
  3. Откройте отчет о файлах Sitemap.
  4. Введите относительный URL файла на странице отчета и нажмите Отправить.

Файл Sitemap сразу же будет обработан, однако для сканирования перечисленных в нем URL может потребоваться некоторое время. Иногда просканировать удается не все URL (это зависит от размера сайта, трафика и других факторов).

Как повторно отправить файл Sitemap

Если вы уже отправляли нам определенный файл Sitemap, не нужно делать это повторно, даже если вы внесли в него изменения. Новая информация будет обнаружена при следующем сканировании вашего сайта.

Как удалить файл Sitemap

Если вы удалите файл Sitemap, он исчезнет из отчета, но останется известным для Google, как и все перечисленные в нем URL. Если вам нужно, чтобы роботы Google перестали посещать ваши веб-страницы, добавьте правило в файл robots.txt.

Чтобы удалить файл Sitemap, выполните следующие действия:

  1. В основной таблице отчета найдите файл, который нужно удалить, и нажмите на него.
  2. На странице сведений о файле нажмите на значок в виде трех точек Ещё.
  3. Выберите Удалить файл Sitemap.
  4. Чтобы роботы Google больше не обращались к файлу Sitemap, удалите его с сайта или запретите доступ к нему с помощью файла robots.txt.

Интерпретация данных в отчете

  • В отчете видны только файлы Sitemap, отправленные с помощью этого отчета или специального API, а не обнаруженные по ссылкам в файле robots.txt или другими способами. Если мы уже получили ваш файл Sitemap из другого источника, вы можете дополнительно отправить его нам через этот отчет для того, чтобы проследить за соотношением удачных и неудачных попыток обработать URL в таком файле.
  • В отчете показываются только файлы Sitemap, которые относятся к выбранному в настоящий момент ресурсу.
  • В файле Sitemap можно указывать URL изображений, видео и новостных статей. Но в настоящее время в отчете не отображаются сведения о таких адресах.

Для каждого файла Sitemap указывается следующая информация:

URL файла Sitemap
Адрес, по которому размещен файл, относительно корневого каталога ресурса.
Тип
Тип файла Sitemap. Возможные значения:
Отправлен
Дата, когда файл Sitemap был последний раз отправлен в Google.
Дата последней обработки
Дата, когда файл Sitemap был последний раз обработан инструментами Google.
Статус
Статус отправки или сканирования. Возможные значения:
  • Успешно – файл Sitemap загружен и обработан без ошибок. Все URL добавлены в очередь на сканирование.
  • Обнаружены проблемы – файл Sitemap содержит ошибки, однако все URL, которые удалось из него извлечь, добавлены в очередь на сканирование. Нажмите на файл в таблице, чтобы увидеть список ошибок. Ниже приведены их подробные описания.
  • Не получено – не удалось получить файл Sitemap. Чтобы выяснить причину, воспользуйтесь инструментом проверки URL:
    1. Укажите полный путь к отправленному файлу. Для этого скопируйте префикс пути с карточки "Добавьте файл Sitemap" и после него вставьте относительный путь. Пример: https://example.com/sitemaps/mobile/sitemap.txt. Копируйте значения непосредственно из отчета, чтобы точно проверить именно тот URL, который использует Google.
    2. Нажмите Выполнить проверку. Появится информация о том, существует ли файл Sitemap и есть ли у нас к нему доступ.
Количество выявленных URL
Количество URL, перечисленных в файле Sitemap. Если это файл типа "индекс Sitemap", то здесь указывается общее количество URL во всех включенных в него файлах. Повторяющиеся URL учитываются только по одному разу.
При нажатии на этот значок открываются сведения о покрытии всех URL в отчете. В случае с индексом Sitemap указываются все URL, перечисленные в его дочерних файлах Sitemap.

Моего файла Sitemap нет в отчете

Вот несколько причин, по которым файл Sitemap может отсутствовать в отчете:

  • Он относится к другому ресурсу. Файлы Sitemap, связанные с одним ресурсом, не видны при выборе другого. Например, файлы, предназначенные для сайта http://example.com, не будут представлены в отчете о ресурсе http://m.example.com или https://example.com. Убедитесь, что вы добавили в Search Console все версии URL своего сайта.
  • Вы не отправляли файл Sitemap через отчет. Файлы, обнаруженные или добавленные другим способом, не показываются в отчете, даже если Google может находить и использовать их.

Ошибки в файлах Sitemap

В отчете по файлам Sitemap может появляться информация об ошибках, перечисленных ниже.

Полный список ошибок

URL недоступны

Google не удалось просканировать адреса из файла Sitemap. Проверьте, доступны ли URL в нем нашему роботу, с помощью этого инструмента.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • При переходе по URL слишком много раз выполняется переадресация, и поисковые роботы Google останавливаются, не достигая цели. Рекомендуем заменить все URL переадресации на адреса непосредственно тех страниц, которые нужно просканировать.
    • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, для перехода на другую страницу своего сайта указывайте URL https://www.example.com/mypage.html, а не просто mypage.html.

Нельзя использовать URL

Некоторые из перечисленных вами URL находятся в другом домене или на более высоком уровне по сравнению с файлом Sitemap.

Более высокий уровень. Если файл расположен по адресу http://www.example.com/mysite/sitemap.xml, то недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в соседнем каталоге (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все URL начинаются с того же домена, в котором хранится ваш файл Sitemap. Например, если файл расположен по адресу http://www.example.com/sitemap.xml, то недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан префикс протокола https вместо http.

Ошибка сжатия

Произошла ошибка при попытке восстановить сжатый файл Sitemap. Выполните повторное сжатие файла (например, с помощью gzip), после чего загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Исправьте это.

Превышен максимальный размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе Sitemap, а затем отправьте нам этот индекс.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Неправильно введена дата

Как минимум одна дата в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Введите все даты в одном из допустимых форматов W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или ошибки, например имеет префикс htp:// вместо http://.

Убедитесь, что URL в файле Sitemap указаны в правильной кодировке и должным образом экранированы. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, сможет ли программа распознать его и загрузить страницу.

Неполные URL в файле индекса Sitemap

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится индекс. Например, если индекс расположен по адресу http://www.example.com/folder1/sitemap_index.xml и указывает на файл sitemap.xml (без символа / впереди), то Google ищет этот файл Sitemap по адресу http://www.example.com/folder1/sitemap.xml. Если найти его не удается, показывается сообщение об ошибке.

Добавьте в индекс Sitemap полные URL всех нужных файлов Sitemap и отправьте его ещё раз.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и отправьте файл Sitemap ещё раз.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки, с которой связана проблема. Сведения об обязательных тегах можно найти в этой статье.

Отсутствует URL значка видео

В некоторых записях о видео нет ссылки на значок. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех значков видео.

Отсутствует название видео

В некоторых записях о видео отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео.

Вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Зачастую это происходит из-за неэкранированных символов в URL. Во всех файлах XML в любых значениях данных (включая URL) необходимо экранировать символы &, ', ", <, > и некоторые другие. Проверьте, правильно ли выполнено экранирование в URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.

В файле Sitemap слишком много URL

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для удобства можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если файл содержит информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (') или двойные (") кавычки, которые должны быть только прямыми. Обратите внимание, что текстовые редакторы, например Microsoft Word, могут автоматически менять кавычки на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (пример: http://example.com/sitemap.xml), однако этот префикс есть в URL, которые перечислены в файле (пример: http://www.example.com/myfile.html).

Удалите префикс www из всех URL внутри файла.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (пример: http://www.example.com/sitemap.xml), однако этого префикса нет в URL, которые перечислены в файле (пример: http://example.com/myfile.xml).

Добавьте префикс www во все URL внутри файла.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Ниже приведены примеры.

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файлов Sitemap

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с объявления пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Указанная проблема не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандарту XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP [код ошибки]

При попытке скачать файл Sitemap произошла ошибка HTTP. В сообщении о такой ошибке показывается код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Слишком большой значок видео

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить в файл Sitemap информацию о видео

Слишком маленький значок видео

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap. Подробнее о том, как добавить в файл Sitemap информацию о видео

Адреса видео и страницы воспроизведения совпадают

URL видео и страницы проигрывателя, указанные в файле Sitemap для видео, не должны совпадать. Если используются одновременно тег <video:player_loc> и тег <video:content_loc>, то URL в них должны различаться. Подробнее о том, как добавить в файл Sitemap информацию о видео

URL видео указывает на страницу воспроизведения

URL в теге <video:content_loc> в файле Sitemap для видео указывает на страницу, где размещен проигрыватель. Подробнее о том, как добавить в файл Sitemap информацию о видео

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt. Воспользуйтесь инструментом проверки URL, чтобы выяснить, на какой именно файл влияет блокировка доступа, и внесите в директивы robots.txt необходимые изменения.

Эта информация оказалась полезной?
Как можно улучшить эту статью?