テーブル名と場所
Search Console の一括データのエクスポートでは、BigQuery プロジェクトに次のテーブルが作成されます。
データセット名: searchconsole
(カスタマイズできるため、設定時に別の名前が選択される場合があります)
テーブルのリスト:
- searchdata_site_impression: プロパティ別に集計されたプロパティのパフォーマンス データが含まれます。
- searchdata_url_impression: URL 別に集計されたプロパティのパフォーマンス データが含まれます。
- ExportLog: 以前のデータテーブルのいずれかに対する成功したエクスポートごとの情報が含まれます。通常、Search Console はこれらのテーブルに個別にエクスポートを行います。失敗したエクスポートの試行はここには記録されません。
一括データ エクスポート: テーブルとヒント - Google Search Console トレーニング
テーブルの保存スケジュール
Search Console は 1 日に 1 回一括データをエクスポートしますが、必ずしも各テーブルのデータが同時にエクスポートされるわけではありません。
接続の問題などの一時的なエラーが発生した場合、Search Console は通知をトリガーせずに直ちに再試行を続行します。
書き込み試行中に一時的でないエラー(権限エラーなど)が発生した場合、Search Console は、翌日のスケジュール設定されたエクスポートまで、テーブルのエクスポートを再試行しません。Search Console は約 1 週間にわたって当該日のデータのエクスポートを再試行してから、当該日のデータの保存を停止します。たとえば、Search Console が 1 日目のデータを保存しようとしたときに認証エラーが発生し、そのエラーが 9 日目まで解決されない場合、1 日目と 2 日目のデータはエクスポートされませんが、9 日目にアクセスが回復した時点で残りの日のデータが追加されます。
処理エラーが解決されたために Search Console が以前に保存されたデータを修正する必要がある場合、すべての変更がアトミックになります。つまり、その日のすべてのデータは Search Console の 1 回の commit で更新されます。古いデータの修正は頻繁には発生せず、メールはトリガーされませんが、エクスポート ログに記録されます。
パフォーマンス データは Search Console によって徐々に蓄積されるため、テーブル行には同じキーが繰り返し登録されます。このデータは、テーブルにエクスポートする前に圧縮されません。そのため、ほぼ毎回すべての指標を集計する必要があります。
データの保持期間
デフォルトでは、テーブルは永続的に保持され、パーティションと同様に、Google Cloud プロジェクトまたは組織によって設定されたグローバル デフォルトが適用されます。
データが無期限に発生しないようにするには、許容される期間(1 か月、6 か月、12 か月など、ニーズおよび発生するデータの量に応じた妥当な期間)の経過後に有効期限が切れるよう、パーティションに有効期限を設定することをおすすめします。テーブル全体に有効期限を設定するとすべてのデータが削除されるため、望ましくありません。
テーブルのスキーマ
Search Console によってエクスポートされるテーブルのスキーマは次のとおりです。すべてのテーブルには、接頭辞 <your_project_ID>.searchconsole
が付きます。
searchdata_site_impression テーブル
このテーブルには、プロパティ別に集計されたデータが含まれます。このテーブルには次のフィールドがあります。
- data_date: この行のデータが生成された日付(太平洋時間)。
- site_url: プロパティの URL。ドメインレベルのプロパティの場合、sc-domain:property-name になります。URL プレフィックス プロパティの場合、プロパティ定義の完全な URL になります(例: sc-domain:developers.google.com, https://developers.google.com/webmasters-tools/)。
- query: ユーザーのクエリ。is_anonymized_query が true の場合、長さがゼロの文字列になります。
- is_anonymized_query: まれなクエリ(匿名化されたクエリ)は、このブール値でマークされます。このフィールドが true の場合、クエリを行ったユーザーのプライバシーを保護するため、クエリ フィールドは null になります。
- Country: クエリが行われた国(ISO-3166-1-Alpha-3 形式)。
- search_type - 次のいずれかの文字列値になります。
- web: Google 検索のデフォルトの [すべて] タブ。
- image: Google 検索の [画像] タブ。
- video: Google 検索の [動画] タブ。
- news: Google 検索の [ニュース] タブ。
- discover: Discover の結果。
- googleNews: news.google.com と Google ニュース アプリ(Android と iOS)
- device: クエリが行われたデバイス。
- impressions: この行のインプレッション数。
- clicks: この行のクリック数。
- sum_top_position: そのテーブルの行の各インプレッションに対する、検索結果におけるサイトの最上位の掲載順位の合計(0 は結果における最上位の掲載順位です)。平均掲載順位(1 ベース)求めるには、
SUM(sum_top_position)/SUM(impressions) + 1
を計算します。
searchdata_url_impression テーブル
このテーブルには URL 別に集計されたデータが含まれています。このテーブルには次のフィールドがあります。
- data_date: 同上。
- site_url: 同上。
- url: ユーザーが検索結果や Discover のストーリーをクリックした際に最終的に表示される完全修飾 URL。
- query: 同上。
- is_anonymized_query: 同上。
- is_anonymized_discover: データ行が Discover の匿名化しきい値を下回っているかどうかを示します。しきい値を下回っている場合、ユーザーのプライバシー保護のため、他の一部のフィールド(url や country など)は表示されなくなります。
- country: 同上。
- search_type: 同上。
- device: 同上。
- is_[search_appearance_type]: 検索での見え方のタイプを示すのに使用されるブール値フィールドがいくつかあります(is_amp_top_stories、is_job_listing、is_job_details など)。特定のリッチリザルトで問題の行が表示される場合、フィールドは true になります。
- impressions: 同上。
- clicks: 同上。
- sum_position: クエリの検索結果における URL の最上位の掲載順位を示す 0 ベースの数値(0 は結果における最上位の掲載順位です)。平均掲載順位(1 ベース)を求めるには、
SUM(sum_position)/SUM(impressions) + 1
を計算します。
ExportLog テーブル
このテーブルには、その日にどのようなデータが保存されたかが記録されます。失敗したエクスポートはここに記録されません。トラッキングの失敗の詳細をご覧ください。このテーブルには次のフィールドがあります。
- agenda: 保存されたデータの種類。現在、値は SEARCHDATA のみです。
- namespace: 保存先のテーブル。通常、Search Console はテーブルごとに個別にデータをエクスポートするため、各日に 2 つのエクスポート行があるのが一般的です。
- data_date: クリックまたはインプレッションの日付(太平洋時間)。これはテーブルで使用されるパーティションの日付です。
- epoch_version: 整数。0 はこの日付のデータが初めてこのテーブルに保存されたことを示します。まれに、データの異常などのために Search Console が前のデータに戻って調整しなければならないことがあります。このような場合、そのテーブルと日付のデータが更新されるたびに、この値が 1 ずつ増加します。
- publish_time: エクスポートが完了した時刻(太平洋時間)。