BigQuery は、大規模なデータセットに対しパフォーマンスの高いクエリを実行できるクラウド データ ウェアハウスです。
すべての未加工のイベントを Google アナリティクス 4 プロパティ(サブプロパティや統合プロパティを含む)から BigQuery にエクスポートし、SQL タイプの構文を使ってそれらのデータにクエリを発行できます。BigQuery では、アナリティクスのデータとの統合を目的に、データを外部ストレージにエクスポートすることや、外部データをインポートすることが可能です。
データを BigQuery にエクスポートすると、そのデータの所有者になり、BigQuery ACL を使用して、プロジェクトやデータセットの権限を管理できます。
1 日 1 回、すべてのデータのエクスポートが行われます。さらに、データのエクスポートは 1 日を通して継続的に実行されます(詳しくは下記の「ストリーミング エクスポート」をご覧ください)。
BigQuery の無料インスタンス(BigQuery サンドボックス)にエクスポートできますが、サンドボックスの制限を超えるエクスポートを行う場合には料金が発生します。
標準プロパティでは、BigQuery Export の 1 日の上限は 100 万イベントです。BigQuery Export のその他の制限に関する詳細
Google アナリティクス インターフェースと BigQuery Export の違い
BigQuery イベント エクスポートでは、未加工のイベントおよびユーザー単位のデータを利用できます。ただし、標準レポートやデータ探索ツールのデータに対し Google アナリティクスが付加した価値は含まれません。このため、BigQuery イベント エクスポート データは、Google アナリティクス インターフェースのデータと異なる場合があります。
BigQuery イベント エクスポートと Google アナリティクスのインターフェースの違いを理解し、可能な限りこれらの違いを小さくする方法について詳しくは、Google アナリティクスの UI と BigQuery Export のギャップを埋めるをご覧ください。
ストリーミング エクスポート
ストリーミング エクスポートは、Google アナリティクス 4 プロパティを BigQuery にリンクした場合に選択できます。
BigQuery ストリーミング エクスポートでは、BigQuery Export を介して当日のデータを数分以内に入手できます。
このエクスポート オプションを使用すると、BigQuery に最新のデータを読み込んで、ユーザーとプロパティのトラフィックを分析できます。
ストリーミング エクスポートでは、次の新しいテーブルが毎日 1 つ作成されます。
events_intraday_YYYYMMDD
: 内部ステージング テーブルです。このテーブルには、その日に発生したセッション アクティビティのレコードが保持されます。ストリーミング エクスポートはベスト エフォート型の処理であり、イベントの遅れやアップロードの失敗などにより、データに漏れが生じる場合もあります。データは 1 日を通して継続的にエクスポートされます。セッションが複数のエクスポート周期にまたがっていると、テーブルにはそのセッションのレコードが複数保存されることがあります。このテーブルは、events_YYYYMMDD
の作成が完了すると削除されます。
BigQuery Export の設定時に日次オプションを選択した場合、次のテーブルも毎日作成されます。
events_YYYYMMDD
: 1 日に 1 回、すべてのイベントがエクスポートされます。
その日の安定したデータセットを分析できるよう、クエリでは、events_intraday_YYYYMMDD
ではなく events_YYYYMMDD
を使用するようにしてください。
events_YYYYMMDD
テーブルと events_intraday_YYYYMMDD
テーブルについて詳しくは、BigQuery Export スキーマをご覧ください。
BigQuery のストリーミング エクスポートには、新規ユーザーについては次のユーザー アトリビューション データは含まれません。
- traffic_source.name(レポート ディメンション: ユーザーのキャンペーン)
- traffic_source.source(レポート ディメンション: ユーザーの参照元)
- traffic_source.medium(レポート ディメンション: ユーザーのメディア)
既存ユーザーのユーザー アトリビューション データは含まれていますが、そのデータの処理が完了するまでには約 24 時間かかります。このため、ユーザー アトリビューション データはストリーミング エクスポートに頼らず、1 日ごとの完全エクスポートから取得することをおすすめします。
ストリーミング エクスポートを使用すると、BigQuery ではデータ 1 GB あたり 0.05 ドルの追加費用が発生します。1 GB は、Google アナリティクスのイベント約 60 万件に相当します(この数は、イベントのサイズによっても異なります)。詳しくは、BigQuery の料金をご覧ください。
テーブルの更新のスケジュール
BigQuery Export の一部として作成されたテーブルの更新は、データのエクスポート元のアナリティクス プロパティのタイムゾーンに則って実施されます。
ストリーミング エクスポートのテーブル(events_intraday_YYYYMMDD)は、1 日を通して継続的に更新されます(例: プロパティのタイムゾーンで、午前 12:00:00 から午後 11:59:59 まで)。プロパティのタイムゾーンで新しい日が始まると、その日の新しいテーブルにイベントが書き込まれます。
日次エクスポートのテーブル(events_YYYYMMDD)は、その日のイベントがすべて収集された後に作成されます。アナリティクスでは、テーブルの日付から最大 72 時間日次テーブルが更新されます。その際、テーブルの日付でタイムスタンプが付いたイベント(例: Measurement Protocol または Firebase SDK から遅れて送信されるイベント バンドル)が使用されます。たとえば、テーブルの日付が 20220101 の場合、20220101 のタイムスタンプが付いたイベントを使用して、20220104 までテーブルが更新されます。
過去のデータの再処理が必要になる場合(処理エラーに対処するバグの修正など)、72 時間が経過した後でも、日次テーブルが随時更新されることがあります。
Cookie のない ping とユーザー提供データ
同意モードが実装されている場合、BigQuery のエクスポートにはアナリティクスで収集された Cookie のない ping が、user_id やカスタム ディメンションなどのユーザー提供データとともに含まれます。
「Not Available」のトラフィック ソースのディメンションをバックフィルする
次のリソースを使用して、特定の GCLID のアトリビューション トラフィック ソースのディメンションを検索できます。wBRAID 識別子と gBRAID 識別子は BigQuery Export には含まれません。
- Google Ads API
- Google 広告のスクリプト
- Google 広告用 BigQuery Data Transfer Service
[traffic_source] 列の [Not Available] レコードの GCLID を確認するには、[collected_traffic_source] 列の GCLID フィールドをクエリします。特定の GCLID から Google 広告のキャンペーン情報を検索する方法について詳しくは、BigQuery Export サービスレベル契約をご覧ください。
GA4 - Firebase の統合と BigQuery
GA4 プロパティと Firebase プロジェクトが統合されている場合は、別の BigQuery プロジェクトにリンクすることはできません。
Google アナリティクス 4 とユニバーサル アナリティクスの BigQuery Export の比較
Google アナリティクス 4 | ユニバーサル アナリティクス |
---|---|
標準(無料)と 360(有料)で利用可 標準の上限: 1 日あたり 100 万件のイベント 360 の上限: 1 日あたり数十億件のイベント |
360(有料)で利用可 |
費用 BigQuery サンドボックスに無料でエクスポート可(サンドボックスの制限範囲内) 契約の条件に基づき、エクスポートしたデータがサンドボックスの制限範囲を超えると料金が発生 |
費用 BigQuery サンドボックスに無料でエクスポート可(サンドボックスの制限範囲内) 契約の条件に基づき、エクスポートしたデータがサンドボックスの制限範囲を超えると料金が発生 |
設定 各プロパティにおける特定のデータ ストリームを追加、および特定のイベントを除外できる (エクスポートの数と費用をコントロール可) |
設定 プロパティごとに 1 個のビューをリンクできる (そのビューで全データをエクスポート可) |
ストリーミング エクスポート GB あたり $0.05(BigQuery の料金の詳細) 作成されるテーブル: events_intraday_YYYYMMDD 以下の条件でテーブルは毎日削除される:
新規ユーザーに関する「ユーザーのキャンペーン」、「ユーザーの参照元」、「ユーザーのメディア」のデータは含まれない |
ストリーミング エクスポート GB あたり $0.05(BigQuery の料金の詳細) 作成されるテーブル: ga_realtime_sessions_YYYYMMDD 作成される BigQuery ビュー: ga_realtime_sessions_view_YYYYMMDD |
日次エクスポート 作成されるテーブル: events_YYYYMMDD |
日次エクスポート 作成されるテーブル ga_sessions_intraday_YYYYMMDD
ga_sessions_YYYYMMDD
|
毎日(高頻度)エクスポート 360 プロパティの「標準」と「大」で利用可能 観測されたユーザー アトリビューション データや広告インプレッション データなど、日次エクスポートに含まれるすべてのデータフィールドと列が含まれます。 |
該当なし |
エクスポート、全般 バックフィル: バックフィルなし データセット: リンクされているプロパティごとに、analytics_<property id> という名前のデータセット 1 個 同意モードを実装している場合、エクスポートに含まれるもの:
|
エクスポート、全般 バックフィル: リンク時に、13 か月分のデータまたは 100 億ヒットのいずれか少ない方 (BigQuery サンドボックスへのバックフィルは失敗する可能性あり) データセット: リンクされているビューごとに、ビューと同じ名前のデータセット 1 個 |
エクスポート スキーマ GA4 では、ユーザーを最初に獲得したトラフィック ソースのみがエクスポートされます BigQuery にエクスポートされた UA データはサポートされていません BigQuery テーブルの各行はイベントを表します Google アナリティクス 4 に固有のイベントデータ Google アナリティクス 4 の一部のフィールドには、実質的にユニバーサル アナリティクスのフィールドと同じものがありますが( |
エクスポート スキーマ 複数のタッチポイントにまたがるセッション単位のアトリビューション BigQuery テーブルの各行はセッションを表す ユニバーサル アナリティクスに固有のヒットデータ ユニバーサル アナリティクスの一部のフィールドには、本質的に Google アナリティクス 4 のフィールドと同じものがありますが( |
関連資料
次の事項の詳細については、BigQuery のデベロッパー ガイドをご確認ください。