Поиск
Удалить поисковый запрос
Закрыть поиск
Приложения Google
Главное меню

Работа с отчетом по файлу Sitemap

Файл Sitemap предоставляет поисковым роботам, таким как Googlebot, список ва веб-страниц. Он не только помогает обнаружить контент, но и предоставляет дополнительные метаданные, например периодичность изменения информации на сайте (то есть насколько часто его нужно обрабатывать) и сведения о контенте (например, описания видео или изображений. На странице "Файлы Sitemap" в Search Console можно просматривать, добавлять и проверять такие файлы.

Этот отчет вам не понадобится, если вы не можете изменять файл Sitemap своего сайта. Так, при использовании автоматизированных сервисов хостинга, например Google Сайтов, он создается без вашего участия.

 

Открыть отчет по файлам Sitemap

 

Работа с отчетом по файлу Sitemap

На главной странице этого отчета вы увидите список файлов Sitemap, добавленных в Search Console. Внимание! Если вы используете другие способы управления сканированием, например google.com/ping или файл robots.txt, данные по ним не будут представлены в этом разделе.

Нажмите на нужный файл в таблице, чтобы просмотреть более подробные сведения о нем, а также информацию об ошибках. Если это контейнер с несколькими файлами Sitemap, то вы увидите их все.

Моего файла Sitemap нет в списке

Проверьте следующие настройки:

  • Каков основной домен вашего ресурса? Роботы Google воспринимают http://www.example.com, http://example.com, https://www.example.com и https://example.com как разные сайты. Поэтому файлы, относящиеся к URL http://example.com, не будут отображаться на странице Файлы Sitemap в инструменте Search Console для сайта http://www.example.com. Чтобы решить эту проблему, добавьте все варианты адреса своего сайта и сообщите Google, какой из них является основным доменом.
  • Кем отправлен файл Sitemap? Если это сделали вы, то он отобразится в вашем аккаунте на вкладке Мои. Прочие файлы вы найдете в разделе Все.
  • Какой метод вы используете для управления сканированием? В списке представлены только файлы Sitemap, добавленные со страницы отчета. Если вы отправляли их с помощью инструмента google.com/ping или файла robots.txt, они не будут здесь указаны, даже если Google обнаруживает и может использовать эти файлы.

Как создать файл Sitemap

Инструкции

Как проверить файл Sitemap

Перед отправкой файла Sitemap его нужно проверить на синтаксические ошибки.

Проверка файла до отправки

  1. Нажмите кнопку Добавление/проверка файла Sitemap на странице отчета.
  2. Укажите URL файла и нажмите Проверить файл Sitemap.
  3. Когда операция будет завершена, нажмите Просмотреть результаты проверки. Исправьте ошибки.
  4. Нажмите Отправить файл Sitemap.

Проверка ранее отправленного файла

Откройте страницу сведений о файле и нажмите Проверить.

Как отправить файл Sitemap (впервые)

  1. Проверьте файл, как описано выше.
  2. Нажмите кнопку Добавление/проверка файла Sitemap.
  3. В текстовое поле добавьте URL, связанный с корневым каталогом сайта.
  4. Нажмите Отправить файл Sitemap.
  5. Обновив вкладку в браузере, вы увидите добавленный файл в общем списке.
  6. Нажмите на добавленный файл, чтобы открыть страницу "Сведения о файле Sitemap". Если Google обнаружил ошибки в нем или в URL, которые он содержит, выполните проверку и примите необходимые меры.

Обработка добавленного файла может занять некоторое время. Обратите внимание, что мы не гарантируем сканирование и индексацию всех URL.

Как повторно отправить файл Sitemap

  1. Откройте отчет по файлам Sitemaps.
  2. Укажите нужные файлы.
  3. Нажмите кнопку Отправить файл Sitemap повторно.
Кроме того, можно повторно отправить файл Sitemap, выслав HTTP-запрос GET на следующий URL (его вторая часть – это URL вашего файла):
http://google.com/ping?sitemap=http://www.example.com/my_sitemap.xml

Как удалить файл Sitemap

Файл Sitemap можно удалить из аккаунта, чтобы он больше не отображался в Search Console.

  1. На странице "Файлы Sitemap" установите флажки рядом с файлами, которые больше не нужны.
  2. Выберите Удалить.

Удаление файла Sitemap из Search Console не препятствует его сканированию. Google сможет его обрабатывать, пока вы не заблокируете к нему доступ с помощью файла robots.txt или не удалите файл с сайта (удалить ссылку на него в файле robots.txt недостаточно). Если вы хотите оставить его на сервере, чтобы с ним работали другие поисковые системы, попробуйте заблокировать в robots.txt доступ к нему роботу Googlebot.

 

Ошибки в файле Sitemap и их устранение

На странице "Файлы Sitemap" могут отображаться следующие ошибки и предупреждения:

Полный список ошибок

URL недоступны

Google не удалось просмотреть адреса из файла Sitemap.

  1. Убедитесь, что файл находится именно там, где указано.
  2. С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ.
  3. Используйте Сканер Google для сайтов, чтобы определить, настроена ли блокировка страницы в файле robots.txt.
  4. Если сканировался URL из вашего файла Sitemap, проверьте, нет ли ошибок в адресе.

Переход по URL не выполнен

Обычно указывает на то, что при обработке файла Sitemap роботу Google не удалось открыть некоторые URL, потому что по ним выполняется слишком много перенаправлений. Измените URL переадресации в файле Sitemap и замените их на URL назначения (цель перенаправления).

Ниже описано, почему могла иметь место такая ошибка и как ее исправить.

  • Проверьте сайт с помощью текстового браузера (например, Lynx), поскольку большинство поисковых систем видят сайт точно так же, как Lynx. Если вам не удается просмотреть весь сайт с помощью текстового браузера из-за таких элементов как JavaScript, cookie, идентификаторы сеансов, фреймы, DHTML или Flash, то и сканерам поисковых систем, скорее всего, тоже будет трудно его обработать.
  • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянные перенаправления. Рекомендуем отказаться от переадреcации с помощью JavaScript или метатега refresh.
  • По возможности используйте абсолютные ссылки вместо относительных. Например, ссылаясь на другую страницу своего сайта, используйте URL https://www.example.com/moya-stranitsa.html, а не просто moya-stranitsa.html.

Недействительные URL

Некоторые URL-адреса находятся на более высоком уровне по отношению к файлу Sitemap или в другом домене.

Более высокий уровень: если файл находится на странице http://www.example.com/moy_sait/sitemap.xml, то для него недействительны следующие URL-адреса:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – расположен в каталоге, параллельном текущему местонахождению файла Sitemap.

Другой домен: убедитесь, что все адреса начинаются с домена, в котором хранится ваш файл Sitemap. Например, если файл находится на странице http://www.example.com/sitemap.xml, то для него недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан протокол https вместо http.

Ошибка сжатия

Ошибка при попытке распаковать заархивированный файл Sitemap. Выполните сжатие ещё раз (например, с помощью gzip), а затем загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Убедитесь, что он не пустой. Если файл использует протокол Sitemap, проверьте правильность тегов в URL.

Ошибка размера файла Sitemap: превышен максимально допустимый размер файла Sitemap...

Размер файла Sitemap в несжатом виде превышает 10 МБ. Разбейте его на несколько файлов и укажите их в индексе, а затем отправьте нам каждый из них отдельно.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Недопустимая дата

Одна или несколько дат в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Убедитесь, что все даты записаны в одном из допустимых форматов кодировки согласно W3C.

2005-02-21
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. В сообщении об ошибке они все должны быть указаны. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. д.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или имеет неверный формат, например htp:// вместо http://. Убедитесь, что в URL, указанных в файле Sitemap, используются правильные коды экранирования и кодировка. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, сможет ли программа распознать его и загрузить страницу.

Недействительный URL в файле индекса Sitemap: неполный URL

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL-адреса. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится файл индекса. Например, если индекс находится по адресу http://www.example.com/folder1/sitemap_index.xml и адрес файла Sitemap в нем указан как sitemap.xml, наш робот попытается загрузить его по адресу http://www.example.com/folder1/sitemap.xml. Если робот Google не обнаружит файл Sitemap по этому адресу, попытка закончится ошибкой.

Обновите файл индекса Sitemap, добавив в него полные URL-адреса всех перечисленных файлов Sitemap, а затем ещё раз отправьте файлы.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/stranitsa1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и ещё раз отправьте файл Sitemap.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки. Сведения о обязательных тегах можно найти в статье о файлах Sitemap.

Отсутствует URL значка видео

В одной или нескольких записях о роликах отсутствует ссылка на значок видео. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех таких значков.

Отсутствует название видео

В некоторых записях о роликах отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео.  

Неверный формат индекса Sitemap: вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap.

Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на файлы индекса.

Удалите записи, указывающие на файлы индекса Sitemap и повторно отправьте файл Sitemap в Google.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Часто это происходит из-за неэкранированных символов в одном из URL. Как и в файлах XML, любые значения данных (включая адреса URL) должны использовать экранирующие коды для некоторых символов, таких как & ' " < >. Проверьте, правильно ли настроено экранирование URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.

Слишком много URL в файле Sitemap

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для управления ими можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл. Он должен быть в формате XML и содержать правильный заголовок.

Распространенные ошибки XML:

  • Во файлах Sitemap должны быть правильные заголовки. Например, если содержание файла представляет информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (') или двойные (") кавычки, которые должны быть только прямыми. Внимание! Текстовые редакторы, например Microsoft Word, могут автоматически менять их на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (например, http://example.com/sitemap.xml), а все перечисленные в нем URL содержат (например, http://www.example.com/myfile.html).

Если вы хотите удалить префикс www из файла Sitemap, но сохранить его в URL, указанных в файле, выберите вариант с префиксом в качестве основного домена.

В противном случае измените файл Sitemap, удалив префикс www из всех URL.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (например, http://www.example.com/sitemap.xml), а перечисленные в нем URL не содержат (например, http://example.com/myfile.xml).

Если вы хотите сохранить префикс www в файле Sitemap, но удалить его из указанных в файле URL, выберите вариант без префикса в качестве основного домена.

В противном случае измените файл Sitemap, добавив префикс www во все URL.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Пример:

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap:  <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файла Sitemap...

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Эта ошибка не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандартам XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP (конкретный код)

При попытке скачать файл Sitemap произошла ошибка HTTP. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Значок видео слишком велик

Значок видео, указанный в файле Sitemap, слишком велик. Более подробная информация приводится на странице Лаборатории файлов Sitemap для видео. Уменьшите размер значка до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить информацию о видео в файл Sitemap...

Значок видео слишком мал

Значок видео, указанный в файле Sitemap, слишком мал. Увеличьте его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap.

Местоположения видео и страницы воспроизведения совпадают

URL видео и страницы воспроизведения не должны совпадать. Если используются оба тега (<video:player_loc> и <video:content_loc>), URL должны различаться.

URL местоположения видео указывает на страницу воспроизведения

В файле Sitemap для видео URL <video:content_loc> указывает на страницу, на которой размещен проигрыватель.

Роботу Googlebot заблокирован доступ в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию заблокирован в файле robots.txt. С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ, и внесите изменения, чтобы обеспечить сканирование.

Была ли эта статья полезна?