Управление файлами Sitemap из отчета с данными о них

С помощью отчета о файлах Sitemap вы можете сообщить Google о появлении новых карт вашего сайта, посмотреть историю отправки файлов Sitemap, а также узнать об ошибках, с которыми столкнулась наша система при анализе файла Sitemap.

ОТКРЫТЬ ОТЧЕТ О ФАЙЛАХ SITEMAP

 

Что такое файл Sitemap? Будет ли мне полезен этот отчет?

Файл Sitemap содержит информацию о страницах сайта, на котором он размещен, и помогает Google определять, какие страницы нужно просканировать.

  • Если вы пользуетесь сервисом веб-хостинга (Squarespace, Wix и т. п.), то в нем файл Sitemap может формироваться автоматически. В таком случае вам не нужно создавать его вручную или прибегать к помощи отчета, о котором идет речь. Поищите сведения о файлах Sitemap в справочных материалах своего хостинг-провайдера.
  • Если у вас небольшой сайт (меньше 100 страниц), а по его ссылкам можно перейти от главной страницы к любой другой на нем, то файлы Sitemap и отчет о них вам не нужны. Достаточно запросить индексирование главной страницы. При использовании сервиса веб-хостинга, как уже было сказано выше, никакие действия не требуются.

Подробнее о файлах Sitemap

Управление файлами Sitemap

Sitemaps API
Также для управления файлами Sitemap можно использовать Search Console Sitemaps API. Этот API поддерживает те же функции и позволяет получать ту же информацию, что и отчет.
Как отправить файл Sitemap
"Отправить" файл Sitemap в Google значит сообщить нам, где найти его на вашем сайте. Сам файл в Google не загружается.

Инструкции

  1. Вы сможете отправить файл Sitemap с помощью отчета, только если у вас есть права владельца ресурса. Если таких прав у вас нет, добавьте ссылку на файл Sitemap в файл robots.txt.
  2. Опубликуйте файл Sitemap на своем сайте.
    • Файл должен быть создан в одном из подходящих форматов. Придерживайтесь рекомендаций относительно синтаксиса, расположения файла и т. д.
    • Советуем разместить файл Sitemap на корневом уровне вашего сайта. Если же вы используете сервис веб-хостинга (например, Blogger, Wix или GoDaddy), изучите справочные материалы этого сервиса, чтобы узнать, куда и как добавить файл и есть ли в нем необходимость.
    • Файл Sitemap должен быть доступен роботу Googlebot. Чтобы проверить, так ли это, попробуйте перейти по URL файла Sitemap в режиме инкогнито.
    • Проверьте файл Sitemap на наличие синтаксических ошибок с помощью XML-генератора.
  3. Проверьте, есть ли у Google доступ к файлу Sitemap. Это можно сделать двумя способами:
    • Хороший способ. Введите URL файла Sitemap в адресную строку браузера. Файл Sitemap должен открыться в формате XML. Он будет выглядеть как набор вложенных блоков, а не как обычный сайт.
    • Наилучший способ. Проверьте URL файла Sitemap, следуя приведенным ниже инструкциям, и убедитесь, что доступ к файлу не заблокирован для Google в настройках файла robots.txt или иным способом.
      1. Проверьте URL файла Sitemap.
      2. Нажмите Проверить опубликованную версию. В разделе Доступность должно быть указано "URL можно проиндексировать". Если это не так, должна быть названа причина, по которой это невозможно сделать (например, правило robots.txt, неверный URL или работа брандмауэра). Если у Google нет доступа к файлу Sitemap, устраните эту проблему.
      3. Нажмите Посмотреть проверенную страницу и перейдите на вкладку Источник. Файл Sitemap должен открыться в формате XML. Обычно он выглядит как раскрывающееся дерево значений в браузере. Если вы не видите файл полностью, то выясните, почему хост сайта не показывает его.
  4. Убедившись в том, что ваш файл доступен, откройте отчет о файлах Sitemap.
  5. Скопируйте URL, который вы проверяли на шаге 3, вставьте его в окно Добавьте файл Sitemap и нажмите Отправить.

Файл Sitemap сразу же будет получен, однако сканирование перечисленных в нем URL может занять некоторое время. Возможно, что из-за трафика, размера сайта и других факторов его не удастся обработать полностью.

Время от времени проверяйте, может ли Google получать и обрабатывать ваши файлы Sitemap.

Как повторно отправить в Google файл Sitemap

Если файл Sitemap был успешно просканирован, то его повторная обработка будет выполняться вне обычного расписания.
Если вы внесли в файл Sitemap значительные изменения, которые необходимо немедленно обработать, вы можете отправить его в Google повторно, подав новый запрос. В противном случае он будет обрабатываться в соответствии с обычным расписанием сканирования сайта.
Если файл Sitemap не удается получить при первом запросе или позже при запланированном повторном сканировании, то Google продолжает попытки в течение нескольких дней, а затем прекращает их, если файл по-прежнему недоступен или содержит критические ошибки. В этом случае вы должны устранить проблему и отправить файл повторно, подав новый запрос. В отчете показывается статус последнего сканирования для каждого запроса.

Как удалить файл Sitemap

Если вы удалите файл Sitemap, он исчезнет из отчета, но Google запомнит его и все перечисленные в нем URL. Если вам нужно, чтобы роботы Google перестали посещать ваши веб-страницы, запретите им это с помощью правила в файле robots.txt.

Чтобы удалить файл Sitemap, выполните следующие действия:

  1. В основной таблице отчета найдите файл, который нужно удалить, и нажмите на него.
  2. На странице сведений о файле нажмите на значок в виде трех точек Ещё.
  3. Выберите Удалить файл Sitemap.
  4. Чтобы роботы Google больше не обращались к файлу Sitemap и перечисленным в нем страницам, воспользуйтесь любым из приведенных ниже способов.

Как интерпретировать отчет

Внимание!

  • В отчете видны только файлы Sitemap, отправленные с помощью этого отчета или специального API, а не обнаруженные по ссылкам в файле robots.txt или другими способами. Тем не менее, если мы уже получили ваш файл Sitemap из другого источника, вы все равно можете отправить его нам через этот отчет, чтобы следить за тем, как мы сканируем ваши страницы.
  • В отчете показаны только файлы Sitemap, относящиеся к текущему ресурсу. Если вы не можете найти конкретный файл, убедитесь, что не перепутали ресурсы с префиксами http и https или с элементом www и без него.
  • Если файл Sitemap не удастся обработать с нескольких попыток, Google в конечном итоге прекратит их. Вы должны исправить ошибки и отправить файл ещё раз.
  • В файле Sitemap можно указывать URL изображений, видео и новостных статей. Однако в настоящее время в отчете не отображаются сведения о таких URL.
  • В отчете будет представлено не более 1000 отправленных запросов (причем не в хронологическом порядке), даже если вы добавите запросы сверх этого количества. Сейчас в Search Console нет возможности посмотреть запросы, не вошедшие в первую тысячу.

 

Для каждого файла Sitemap указывается следующая информация:

URL файла Sitemap
Точный URL, который указывается при отправке файла Sitemap. Переадресация не выполняется. Здесь показываются только файлы, отправленные с помощью этого отчета или API.
Тип
Тип файла Sitemap. Возможные значения:
Отправлен
Дата, когда файл Sitemap был последний раз отправлен в Google.
Дата последней обработки
Дата, когда файл Sitemap был последний раз обработан инструментами Google. Указывается, только если мы получили файл.
Статус
Статус последнего сканирования. Возможные значения:
  • Успешно – файл Sitemap загружен и обработан без ошибок. Все URL добавлены в очередь на сканирование.
  • Обнаружены проблемы – файл Sitemap содержит ошибки, однако все URL, которые удалось из него извлечь, добавлены в очередь на сканирование. Нажмите на файл в таблице, чтобы увидеть список ошибок. Ниже приведены их подробные описания.
  • Не получено – не удалось получить файл Sitemap. Чтобы выяснить причину, воспользуйтесь инструментом проверки URL.
    1. Скопируйте путь из отчета о файлах Sitemaps, чтобы проверить именно тот URL, который вы отправили в Google.
    2. Нажмите Выполнить проверку. Появится информация о том, существует ли файл Sitemap и есть ли у нас к нему доступ.
Количество выявленных URL
Количество URL, перечисленных в файле Sitemap. Если это файл типа "индекс Sitemap", то здесь указывается общее количество URL во всех включенных в него файлах. Повторяющиеся URL засчитываются только один раз.
Значок
При нажатии на этот значок открываются сведения о покрытии всех URL в отчете. В случае с индексом Sitemap указываются все URL, перечисленные в его дочерних файлах Sitemap.

 

Моего файла Sitemap нет в отчете

Вот несколько причин, по которым файл Sitemap может отсутствовать в отчете:

  • Он относится к другому ресурсу. Файлы Sitemap, связанные с одним ресурсом, не видны при выборе другого. Например, файлы, предназначенные для сайта http://example.com, не будут представлены в отчете о ресурсе http://m.example.com или https://example.com. Убедитесь, что вы добавили все версии URL своего сайта.
  • Вы не отправляли файл Sitemap с помощью интерфейса отчета или Search Console API. Файлы, обнаруженные или добавленные другим способом, не показываются в отчете, даже если Google может находить и использовать их.

Расписание сканирования файлов Sitemap

Google попытается обработать файл Sitemap, как только вы его отправите. В случае успеха повторная обработка будет выполняться вне обычного расписания, в соответствии с которым сканируется ваш сайт.

Если при получении или обработке файла Sitemap произойдет сбой, то Google продолжит попытки в течение нескольких дней. Если проблема не будет устранена, Google прекратит попытки просканировать этот URL.

Ошибки в файлах Sitemap

В отчете по файлам Sitemap может появляться информация об ошибках, перечисленных ниже. Этот список не является полным, но он достаточно длинный и охватывает большинство ошибок, с которыми вы можете столкнуться.

Список ошибок

URL недоступны

Google не удалось просканировать адреса из файла Sitemap. Проверьте, доступны ли URL в нем нашему роботу, с помощью этого инструмента.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • При переходе по URL слишком много раз выполняется переадресация, и поисковые роботы Google останавливаются, не достигая цели. Рекомендуем заменить все URL переадресации на адреса непосредственно тех страниц, которые нужно просканировать.
    • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, для перехода на другую страницу своего сайта указывайте URL https://www.example.com/mypage.html, а не просто mypage.html.

Нельзя использовать URL

Некоторые из перечисленных вами URL находятся в другом домене или на более высоком уровне по сравнению с файлом Sitemap.

Более высокий уровень. Если файл расположен по адресу http://www.example.com/mysite/sitemap.xml, то недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в соседнем каталоге (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все URL начинаются с того же домена, в котором хранится ваш файл Sitemap. Например, если файл расположен по адресу http://www.example.com/sitemap.xml, то недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан префикс протокола https вместо http.

Ошибка сжатия

Произошла ошибка при попытке восстановить сжатый файл Sitemap. Выполните повторное сжатие файла (например, с помощью gzip), после чего загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Исправьте это.

Превышен максимальный размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе Sitemap, а затем отправьте нам этот индекс.

Неверное значение атрибута

У атрибута в теге XML недопустимое значение. Проверьте файлы Sitemap и убедитесь, что в них есть все необходимые атрибуты с действительными значениями (согласно техническим требованиям к таким файлам), а также что отсутствуют опечатки.

Неправильно введена дата

Как минимум одна дата в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Введите все даты в одном из допустимых форматов W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или ошибки, например имеет префикс htp:// вместо http://.

Убедитесь, что URL в файле Sitemap указаны в правильной кодировке и должным образом экранированы. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, будет ли загружена страница.

Неполные URL в файле индекса Sitemap

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится индекс. Например, если индекс расположен по адресу http://www.example.com/folder1/sitemap_index.xml и указывает на файл sitemap.xml (без символа / впереди), то Google ищет этот файл Sitemap по адресу http://www.example.com/folder1/sitemap.xml. Если найти его не удается, показывается сообщение об ошибке.

Добавьте в индекс Sitemap полные URL всех нужных файлов Sitemap и отправьте его ещё раз.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и отправьте файл Sitemap ещё раз.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки, с которой связана проблема. Сведения об обязательных тегах можно найти в этой статье.

Отсутствует URL значка видео

В некоторых записях о видео нет ссылки на значок. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех значков видео.

Отсутствует название видео

В некоторых записях о видео отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео.

Вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Зачастую это происходит из-за неэкранированных символов в URL. Во всех файлах XML в любых значениях данных (включая URL) необходимо экранировать символы &, ', ", <, > и некоторые другие. Проверьте, правильно ли выполнено экранирование в URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться даже через несколько часов, отправьте файл Sitemap ещё раз.

Слишком много файлов Sitemap

В файле индекса упомянуто более 50 000 файлов Sitemap. Разделите его на несколько, в каждом из которых должно быть указано не более 50 000 файлов Sitemap.

Слишком много URL

В файле Sitemap упомянуто более 50 000 URL. Разделите его на несколько, в каждом из которых должно быть указано до 50 000 адресов. Для удобства можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если файл содержит информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
            xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (') или двойные (") кавычки, которые должны быть только прямыми. Обратите внимание, что текстовые редакторы, например Microsoft Word, могут автоматически менять кавычки на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (пример: http://example.com/sitemap.xml), однако этот префикс есть в URL, которые перечислены в файле (пример: http://www.example.com/myfile.html).

Удалите префикс www из всех URL внутри файла.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (пример: http://www.example.com/sitemap.xml), однако этого префикса нет в URL, которые перечислены в файле (пример: http://example.com/myfile.xml).

Добавьте префикс www во все URL внутри файла.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Ниже приведены примеры.

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файлов Sitemap

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с объявления пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Указанная проблема не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандарту XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP [код ошибки]

При попытке скачать файл Sitemap произошла ошибка HTTP уровня 400. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Общая ошибка HTTP

Произошла ошибка HTTP, которую невозможно отнести ни к одной из приведенных в этом списке. Вы можете воспользоваться инструментом проверки URL, чтобы воспроизвести ошибку, однако она может быть временной. Подождите немного и посмотрите, будет ли она повторяться при дополнительных попытках сканирования.

Слишком большой значок видео

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить в файл Sitemap информацию о видео

Слишком маленький значок видео

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap. Подробнее о том, как добавить в файл Sitemap информацию о видео

Адреса видео и страницы воспроизведения совпадают

URL видео и страницы проигрывателя, указанные в файле Sitemap для видео, не должны совпадать. Если используются одновременно тег <video:player_loc> и тег <video:content_loc>, то URL в них должны различаться. Подробнее о том, как добавить в файл Sitemap информацию о видео

URL видео указывает на страницу воспроизведения

URL в теге <video:content_loc> в файле Sitemap для видео указывает на страницу, где размещен проигрыватель. Подробнее о том, как добавить в файл Sitemap информацию о видео

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt. Воспользуйтесь инструментом проверки URL, чтобы выяснить, на какой именно файл влияет блокировка доступа, и внесите в директивы robots.txt необходимые изменения.

Эта информация оказалась полезной?
Как можно улучшить эту статью?
true
Не знакомы с Search Console?

Ещё не пользовались Search Console? Этот сервис пригодится вам, если вы специалист по поисковой оптимизации, разработчик сайтов или только начали изучать веб-технологии. Начните знакомство с Search Console отсюда.

Поиск
Удалить поисковый запрос
Закрыть поиск
Приложения Google
Главное меню
Поиск по Справочному центру
false
false
true
true
83844
false
false