Отчет о файлах Sitemap

С помощью отчета о файлах Sitemap вы можете отправить в Google карту своего сайта, посмотреть историю ее отправки, а также сведения об ошибках, с которыми столкнулась наша система при анализе файла Sitemap.

ОТКРЫТЬ ОТЧЕТ О ФАЙЛАХ SITEMAP

 

Что такое файл Sitemap? Нужен ли мне этот тип отчета?

Файл Sitemap размещается на вашем сайте и содержит информацию обо всех его новых и измененных веб-страницах. Если ваш ресурс небольшой (менее 100 страниц), возможно, вам будет проще запросить индексацию главной страницы, при условии, что на ней (или на одной из тех, на которую она ссылается непосредственно либо через другие страницы) есть ссылки на все остальные страницы. Подробнее о файлах Sitemap…

Управление файлами Sitemap

Как отправить файл Sitemap

Выполните следующие действия:

  1. Разместите файл Sitemap на своем сайте. Требования:
  2. У вас должно быть разрешение владельца. Если его нет, вы можете вместо отправки файла добавить ссылку на него в файл robots.txt.
  3. Укажите относительный URL файла на странице с отчетом о файлах Sitemap и нажмите Отправить.
  4. Сразу же начнется обработка файла Sitemap. Учтите, что для сканирования перечисленных в нем URL может потребоваться некоторое время. Иногда отсканировать удается не все URL (это зависит от размера сайта, трафика и других факторов).

Внимание!

Если вы уже отправляли нам файл Sitemap, не нужно отправлять его повторно, даже если вы внесли в него изменения (мы заметим их при следующем сканировании сайта).

Как удалить файл Sitemap

Если вы удалите файл Sitemap, он будет удален из соответствующего отчета, но останется в Google, как и все URL, которые были в нем указаны. Если вам нужно, чтобы роботы Google перестали посещать ваши веб-страницы, добавьте правило в файл robots.txt.

Чтобы удалить файл Sitemap, выполните следующие действия:

  1. В основной таблице отчета о файлах Sitemap найдите файл, который нужно удалить, и нажмите на него.
  2. Нажмите на значок меню Ещё
  3. Выберите Удалить файл Sitemap.
  4. Чтобы роботы Google больше не обращались к файлу Sitemap, удалите его с сайта или запретите доступ к нему с помощью файла robots.txt.

Как интерпретировать отчет

  • В отчете показываются только файлы Sitemap, отправленные с его помощью, а не обнаруженные по ссылкам в файле robots.txt или другими способами. Тем не менее, если мы уже получили ваш файл Sitemap из другого источника, вы все равно можете отправить его нам через этот отчет, чтобы мы могли убедиться в правильности данных и определить коэффициент ошибки.
  • В отчете показаны только файлы Sitemap, относящиеся к текущему ресурсу.
  • В файле Sitemap можно передавать URL изображений, видео и новостных статей. Но в настоящее время в отчете не отображаются сведения об этих типах адресов.

 

Для каждого файла Sitemap указывается следующая информация:

URL файла Sitemap
Адрес, по которому размещен файл, относительно корневого каталога ресурса.
Тип
Тип файла Sitemap. Возможные значения:
Отправлен
Дата, когда файл Sitemap был последний раз отправлен в Google.
Дата последней обработки
Дата, когда файл Sitemap был последний раз обработан инструментами Google.
Статус
Статус отправки или сканирования. Возможные значения:
  • Успешно – файл Sitemap загружен и обработан без ошибок. Все URL добавлены в очередь на сканирование.
  • Обнаружены проблемы – файл Sitemap содержит по меньшей мере одну ошибку, однако все URL, которые удалось из него извлечь, будут добавлены в очередь на сканирование. Нажмите на файл в таблице, чтобы увидеть список ошибок. Подробнее об ошибках…
  • Не получено – файл Sitemap не удалось получить. Чтобы выяснить причину, проверьте его с помощью этого инструмента.
    1. Укажите полный путь к файлу, скопировав префикс пути с карточки "Добавьте файл Sitemap" и добавив относительный адрес отправленного файла, например: https://example.com/sitemaps/mobile/sitemap.txt. Копируйте эти адреса непосредственно из отчета, чтобы быть уверенными в том, что вы тестируете тот же URL, который использует Google.
    2. Нажмите Выполнить проверку в инструменте проверки URL. Отобразится информация о том, существует ли файл Sitemap и есть ли у нас к нему доступ.
Количество выявленных URL
Количество URL, перечисленных в файле Sitemap. Если это файл типа "индекс Sitemap", то здесь указывается общее количество URL во всех включенных в него файлах. Повторяющиеся URL засчитываются только один раз.
При нажатии на этот значок открываются сведения о покрытии всех URL в отчете. В случае с индексом Sitemap указываются все URL, перечисленные в его дочерних файлах Sitemap.

 

Моего файла Sitemap нет в списке

Вот несколько причин, по которым файл Sitemap может отсутствовать в отчете:

  • Он относится к другому ресурсу. Файлы Sitemap, связанные с одним ресурсом, недоступны для других. Например, файлы в домене http://example.com не будут представлены в отчете по доменам http://www.example.com или https://example.com. Чтобы решить эту проблему, убедитесь, что вы добавили все версии URL своего ресурса, а затем сообщите нам основной домен и отправьте только относящиеся к нему файлы Sitemap.
  • Вы не отправляли файл Sitemap через отчет. Если вы отправляли файлы Sitemap другим способом, они не будут показаны в списке, даже если Google может найти и использовать их.

Ошибки в файлах Sitemap

В отчете по файлам Sitemap может появляться информация об ошибках, перечисленных ниже.

Полный список ошибок

URL недоступны

Google не удалось просканировать адреса из файла Sitemap. Проверьте, доступны ли URL в нем нашему роботу, с помощью этого инструмента.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • По URL выполняется слишком много переадресаций. Рекомендуем заменить такие URL на адреса, которые могут быть просканированы непосредственно.
    • Если вы постоянно перенаправляете с одной страницы на другую, используйте окончательную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, ссылаясь на другую страницу своего сайта, используйте URL https://www.example.com/moya-stranitsa.html, а не просто moya-stranitsa.html.

Недействительные URL

Некоторые URL-адреса находятся на более высоком уровне по отношению к файлу Sitemap или в другом домене.

Более высокий уровень. Если файл находится на странице http://www.example.com/mysite/sitemap.xml, то для него недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в дочернем каталоге файла Sitemap (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все адреса начинаются с домена, в котором хранится ваш файл Sitemap. Например, если файл находится на странице http://www.example.com/sitemap.xml, то для него недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан протокол https вместо http.

Ошибка сжатия

Ошибка при попытке распаковать заархивированный файл Sitemap. Выполните сжатие ещё раз (например, с помощью gzip), а затем загрузите его на сайт и повторно отправьте в Google.

Пустой файл Sitemap

В файле Sitemap отсутствуют URL. Убедитесь, что он не пустой.

Превышен максимально допустимый размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе, а затем отправьте нам каждый из них отдельно.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Недопустимая дата

Одна или несколько дат в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Убедитесь, что все даты записаны в одном из допустимых форматов кодировки согласно W3C.

2005-02-21
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или другие ошибки форматирования, например имеет префикс htp:// вместо http://.

Проверьте экранирование и кодировку URL, указанных в файле Sitemap. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, сможет ли программа распознать его и загрузить страницу.

Неполные URL в файле индекса Sitemap

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится индекс. Например, если он размещен по адресу http://www.example.com/katalog1/sitemap_index.xml и адрес файла Sitemap в нем указан как sitemap.xml (без косой черты в начале), робот попытается загрузить его по ссылке http://www.example.com/katalog1/sitemap.xml. Если сделать это не удастся, в отчете появится информация об ошибке.

Обновите индекс Sitemap, добавив в него полные URL всех перечисленных файлов Sitemap, и отправьте файлы ещё раз.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/stranitsa1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и ещё раз отправьте файл Sitemap.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки. Сведения о обязательных тегах можно найти в статье о файлах Sitemap.

Отсутствует URL значка видео

В одной или нескольких записях о роликах отсутствует ссылка на значок видео. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех таких значков.

Отсутствует название видео

В некоторых записях о роликах отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео. 

Неверный формат индекса Sitemap: вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Часто это происходит из-за неэкранированных символов в одном из URL. Как и в файлах XML, любые значения данных (включая адреса URL) должны использовать экранирующие коды для некоторых символов, таких как & ' " < >. Проверьте, правильно ли настроено экранирование URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.

Слишком много URL в файле Sitemap

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для удобства можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если содержание файла представляет информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (') или двойные (") кавычки, которые должны быть только прямыми. Внимание! Текстовые редакторы, например Microsoft Word, могут автоматически менять их на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (например, http://example.com/sitemap.xml), а все перечисленные в нем URL содержат (например, http://www.example.com/myfile.html).

Если вы хотите удалить префикс www из файла Sitemap, но сохранить его в URL, указанных в файле, выберите вариант с префиксом в качестве основного домена.

В противном случае измените файл Sitemap, удалив префикс www из всех URL.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (например, http://www.example.com/sitemap.xml), а перечисленные в нем URL не содержат (например, http://example.com/myfile.xml).

Если вы хотите сохранить префикс www в файле Sitemap, но удалить его из указанных в файле URL, выберите вариант без префикса в качестве основного домена.

В противном случае измените файл Sitemap, добавив префикс www во все URL.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Пример:

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файла Sitemap...

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Эта ошибка не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандартам XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP (конкретный код)

При попытке скачать файл Sitemap произошла ошибка HTTP. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Значок видео слишком велик

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить информацию о видео в файл Sitemap…

Значок видео слишком мал

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap. Подробнее о том, как добавить информацию о видео в файл Sitemap…

Местоположения видео и страницы воспроизведения совпадают

Указанные в файле Sitemap URL видео и страницы воспроизведения не должны совпадать. Если используются оба тега (<video:player_loc> и <video:content_loc>), URL должны различаться. Подробнее о том, как добавить информацию о видео в файл Sitemap…

URL местоположения видео указывает на страницу воспроизведения

URL в теге <video:content_loc> в файле Sitemap для видео указывает на страницу, где размещен проигрыватель. Подробнее о том, как добавить информацию о видео в файл Sitemap…

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt. С помощью инструмента проверки URL выясните, какой именно файл вызывает проблему, и внесите в robots.txt необходимые изменения.

Эта информация оказалась полезной?
Как можно улучшить эту статью?