Настройте файлы Sitemap

Как создавать и отправлять файлы Sitemap

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить Google доступ к нему. Подробнее о файлах Sitemap…

Создание и отправка файлов Sitemap

  1. Решите, какие страницы вашего сайта должны сканировать поисковые роботы Google, и определите канонические URL для каждой из них. 
  2. Определите, какой формат файла Sitemap нужно использовать. Создать файлы Sitemap можно как вручную, так и автоматически с помощью сторонних инструментов.
  3. Проверьте файл Sitemap с помощью инструментов, доступных в Search Console.
  4. Сделайте файл Sitemap доступным для Google. Для этого добавьте ссылку на него в файл robots.txt или отправьте его непосредственно в Google с помощью Search Console.

Форматы файлов Sitemap

Google поддерживает несколько форматов файлов Sitemap, описанных ниже. Во всех форматах следует использовать стандартный протокол. Google в настоящее время не поддерживает атрибут <priority> в файлах Sitemap.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

XML

Вот пример простого XML-файла Sitemap с одним URL:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

Подробную документацию и более сложные примеры вы можете найти на сайте sitemaps.org.

Также рекомендуем изучить примеры файлов Sitemap с указанием версий страниц на разных языках и файлов для новостей, графики и видео.

RSS, mRSS и Atom 1.0

Если у вас есть блог с фидом RSS или Atom, можно отправить URL этого фида в качестве источника файла Sitemap. Большинство сервисов для ведения блогов позволяют создать фид, но нужно учитывать, что в нем может быть представлена информация только о последних URL.

  • Google допускает использование фидов RSS 2.0 и Atom 1.0.
  • Отправить в Google сведения о видеоконтенте можно также с помощью фида mRSS (media RSS).
Текстовый файл

Если в файле Sitemap есть только адреса страниц, вы можете отправить Google обычный текстовый файл с этими URL (по одному в каждой строке). Пример:

http://www.example.com/file1.html
http://www.example.com/file2.html

Рекомендации по текстовым файлам Sitemap

  • Необходимо использовать кодировку UTF-8.
  • Файл не должен содержать ничего, кроме списка URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).
Сайты Google

Если сайт был создан и подтвержден с помощью сервиса "Google Сайты", файл Sitemap создается автоматически. Его нельзя изменить, но можно отправить в Google, чтобы получать сведения для отчетов. Обратите внимание, что если в одном подкаталоге содержится более 1000 страниц, файл Sitemap может отображаться некорректно.

  • Если ваши страницы размещены на Google Сайтах, файл Sitemap должен находиться по адресу http://sites.google.com/site/VashSait/system/feeds/sitemap.
  • Если сайт создан с помощью Google Apps, URL файла Sitemap должен быть таким: http://sites.google.com/VashDomen/VashSait/system/feeds/sitemap.

Расширения файлов Sitemap

Google поддерживает расширенный синтаксис в файле Sitemap для приведенных ниже типов информации. С его помощью можно добавлять описание видео, изображений и другого контента для улучшения его индексации.

Общие рекомендации по файлам Sitemap

  • Используйте один и тот же синтаксис при указании URL. Google будет сканировать их в точности по списку. Например, если сайт размещен по адресу http://www.example.com/, не используйте URL /https://example.com/ (без www) или ./MoyaStranitsa.html (относительный URL).
  • Не указывайте в добавляемых URL идентификаторы сессий – это может привести к избыточному сканированию страниц.
  • Сообщите Google о версии страницы на других языках с помощью атрибута hreflang.
  • Файлы Sitemap должны использовать кодировку UTF-8, а в URL необходимо применять экранирование.
  • Разбивайте большие файлы Sitemap на файлы поменьше, чтобы снизить нагрузку на сервер при отправке информации в Google. Файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Создайте файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправьте его в Google вместо отдельных файлов.
  • Используйте рекомендуемые методы канонизации URL, чтобы сообщить Google о версии домена, для которой составлен файл Sitemap (если сайт доступен как с www, так и без www). В этом случае потребуется только один файл Sitemap.
  • Используйте расширения файлов Sitemap для дополнительных типов информации, в частности видео, изображений и новостей.
  • Если у мобильной и обычной версии страницы разные URL, мы рекомендуем указывать только на одну из них. Если все же требуется указание на оба URL, добавьте для них аннотации, чтобы распознавались разные версии.
  • Если существуют версии страницы на других языках или для других регионов, вы можете указать их с помощью файла Sitemap или атрибута hreflang.
  • Применяйте только цифры и латинские буквы. Файл Sitemap обязательно должен быть в кодировке UTF-8 (обычно ее можно выбрать при сохранении). Во всех файлах XML для любых значений данных (включая URL) необходимо применять экранирование элементов при использовании символов, перечисленных в таблице ниже.  Файл Sitemap может содержать только символы ASCII. В нем не должно быть расширенных символов ASCII, определенных управляющих кодов и специальных символов, таких как * и {}. Если они содержатся в URL, то при попытке его добавить появится сообщение об ошибке.
    Символ Маскирование
    Амперсанд & &amp;
    Одинарные кавычки ' &apos;
    Двойные кавычки " &quot;
    Больше чем > &gt;
    Меньше чем < &lt;
    Кроме того, все URL (включая адреса в вашем файле Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это выполняется автоматически, если для создания URL вы применяете какой-либо скрипт, инструмент или файл журнала, то есть не вводите адреса вручную. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

    Ниже представлен пример URL, в котором содержится символ, не относящийся к кодировке ASCII (ü), а также символ, требующий экранирования (&).
    http://www.example.com/ümlat.html&q=name
    Этот же URL, переведенный в кодировку ISO-8859-1 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
    http://www.example.com/%FCmlat.html&q=name
    Этот же URL, переведенный в кодировку UTF-8 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
    Этот же URL, содержащий маскирование:
    http://www.example.com/%C3%BCmlat.html&amp;q=name

Как сделать файл Sitemap доступным для Google

Предоставить Google доступ к файлу Sitemap можно несколькими способами:

  • Отправить его в Google с помощью инструмента Search Console
  • Вставить в любом месте файла robots.txt строку, указывающую на местоположение файла Sitemap:
    Sitemap: http://example.com/adres_sitemap.xml.
  • Воспользоваться запросом ping. Отправьте такой запрос HTTP GET:
      http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap>
    Пример:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Устранение ошибок в файле Sitemap

Ознакомьтесь с этим руководством.

Была ли эта статья полезна?
Как можно улучшить эту статью?