Названия и местоположение таблиц
При массовом экспорте данных из Search Console в вашем проекте BigQuery создаются указанные ниже таблицы.
Название набора данных: searchconsole
(это название можно изменить во время настройки).
Список таблиц:
- searchdata_site_impression. Содержит данные об эффективности ресурсов, сгруппированные по ресурсам.
- searchdata_url_impression. Содержит данные об эффективности ресурсов, сгруппированные по URL.
- ExportLog. Содержит информацию о каждой успешной операции экспорта в одну из вышеуказанных таблиц. Помните, что Search Console обычно экспортирует данные в эти таблицы по отдельности. Неудачные попытки экспорта не записываются.
Массовый экспорт данных в таблицы – Учебный курс по Google Search Console
Расписание сохранения таблиц
Search Console осуществляет массовый экспорт данных один раз в день, но не всегда в одно и то же время.
В случае временной ошибки, такой как проблема с подключением, Search Console сразу же попытается выполнить операцию ещё раз без отправки каких-либо уведомлений.
Если при попытке записи возникнет более серьезная ошибка, например ошибка доступа, Search Console не будет пытаться экспортировать данные в таблицу повторно до наступления даты следующего запланированного экспорта. Search Console будет пытаться экспортировать данные за пропущенный день примерно на протяжении недели, а затем прекратит попытки сохранить данные за этот день. Пример. Если при попытке Search Console сохранить данные за день 1 возникнет ошибка аутентификации, которая будет исправлена только в день 9, то данные за день 1 и 2 не будут экспортированы, тогда как данные за остальные дни будут добавлены в таблицу при восстановлении доступа в день 9.
Если Search Console потребуется изменить ранее сохраненные данные из-за ошибки обработки, которая позже была исправлена, это будет сделано автоматически, то есть все данные за указанный день будут изменены за одну операцию. Исправление ранее сохраненных данных происходит нечасто и не сопровождается уведомлением по электронной почте, но эта операция отражается в журнале экспорта.
Данные об эффективности накапливаются в Search Console инкрементно, в результате чего в таблице образуются строки с повторяющимися ключами. Перед экспортом в таблицы данные не сжимаются. Поэтому вам следует всегда группировать все ваши показатели.
Срок хранения данных
По умолчанию срок хранения таблиц не ограничен, так же как и срок хранения разделов. В обоих случаях он определяется глобальными настройками по умолчанию, заданными вашим проектом или организацией Google Cloud.
Если вы не хотите, чтобы данные накапливались бесконечно, мы рекомендуем установить разумный срок хранения для разделов, например месяц, полгода, год или любой другой срок согласно вашим потребностям и объему накапливаемых данных. В то же время мы не советуем устанавливать срок хранения для всей таблицы, так как эта настройка приведет к удалению всех данных.
Схемы таблиц
Ниже представлены схемы таблиц, экспортируемых сервисом Search Console. В названиях всех таблиц присутствует префикс с идентификатором вашего проекта <your_project_ID>.searchconsole
.
Таблица searchdata_site_impression
Данные в этой таблице сгруппированы по ресурсам. Таблица содержит следующие поля:
- data_date. День, в который были сгенерированы данные в указанной строке (по тихоокеанскому времени).
- site_url. URL ресурса. Для доменных ресурсов он будет выглядеть как sc-domain:название-ресурса. Для ресурсов с префиксом в URL он будет представлять собой полный URL согласно определению ресурса. Примеры: sc-domain:developers.google.com, https://developers.google.com/webmaster-tools/.
- query. Запрос пользователя. Если запрос анонимизированный (поле is_anonymized_query имеет значение true), это поле будет пустым.
- is_anonymized_query. Обозначение редких запросов, известных как анонимизированные. Поле query для такого запроса будет оставаться пустым для защиты конфиденциальности пользователей, отправивших этот поисковый запрос.
- Country. Страна, из которой поступил запрос, в формате ISO-3166-1 alpha-3.
- search_type. Одно из следующих строковых значений:
- web. Вкладка по умолчанию ("Все") в Google Поиске.
- image. Вкладка "Картинки" в Google Поиске.
- video. Вкладка "Видео" в Google Поиске.
- news. Вкладка "Новости" в Google Поиске.
- discover. Раздел "Рекомендации".
- googleNews. Страница news.google.com и приложение "Google Новости" для Android и iOS.
- device. Устройство, с которого был отправлен запрос.
- impressions. Количество показов для этой строки.
- clicks. Количество кликов для этой строки.
- sum_top_position. Сумма самых высоких позиций сайта в результатах поиска для каждого показа в этой строке таблицы, где 0 означает верхнюю позицию в результатах поиска. Чтобы рассчитать среднюю позицию (минимальное значение которой равно 1), используйте формулу
SUM(sum_top_position) / SUM(impressions) + 1
.
Таблица searchdata_url_impression
Данные в этой таблице сгруппированы по URL. Таблица содержит следующие поля:
- data_date. Совпадает с описанием выше.
- site_url. Совпадает с описанием выше.
- url. Полный URL страницы, на которую переходит пользователь, когда нажимает на результат поиска или рекомендацию.
- query. Совпадает с описанием выше.
- is_anonymized_query. Совпадает с описанием выше
- is_anonymized_discover. Определяет, нужно ли анонимизировать данные. Если это так, некоторые другие поля (такие как URL и страна) будут пустыми для защиты конфиденциальности пользователей.
- country. Совпадает с описанием выше.
- search_type. Совпадает с описанием выше.
- device. Совпадает с описанием выше.
- is_[search_appearance_type]. Несколько логических полей, в частности s_amp_top_stories, is_job_listing и is_job_details, используются для обозначения вида в поиске. Поле имеет значение true, если указанная строка появляется в расширенных результатах определенного типа.
- impressions. Совпадает с описанием выше.
- clicks. Совпадает с описанием выше.
- sum_position. Наилучшая позиция URL в результатах поиска по этому запросу (минимальное значение равно нулю и соответствует верхней позиции в результатах поиска). Чтобы рассчитать среднюю позицию (минимальное значение которой равно 1), используйте формулу
SUM(sum_position)/SUM(impressions) + 1
.
Таблица ExportLog
Таблица содержит записи о том, какие данные были сохранены за этот день. Неудачные попытки экспорта не записываются. Узнайте больше о неудачных попытках отслеживания. Таблица содержит следующие поля:
- agenda. Тип сохраненных данных. В настоящее время единственным значением является SEARCHDATA.
- namespace. Таблица, в которую были сохранены данные. Как правило, Search Console экспортирует данные в каждую таблицу по отдельности, поэтому каждому дню соответствуют две строки об экспорте данных.
- data_date. Дата клика или показа по тихоокеанскому времени. Совпадает с датой соответствующего раздела в таблицах.
- epoch_version. Целое число, где значению 0 соответствует первое сохранение данных в эту таблицу в указанную дату. В редких случаях, например ввиду отклонений в данных, Search Console может изменять данные за прошлые периоды. Это значение будет увеличиваться на 1 при каждом изменении данных в этой таблице в указанную дату.
- publish_time. Время завершения экспорта по тихоокеанскому времени.