[GA4] BigQuery Export

 

BigQuery は、大規模なデータセットに対しパフォーマンスの高いクエリを実行できるクラウド データ ウェアハウスです。

すべての未加工のイベントを Google アナリティクス 4 プロパティ(サブプロパティ統合プロパティを含む)から BigQuery にエクスポートし、SQL タイプの構文を使ってそれらのデータにクエリを発行できます。BigQuery では、アナリティクスのデータとの統合を目的に、データを外部ストレージにエクスポートすることや、外部データをインポートすることが可能です。

データを BigQuery にエクスポートすると、そのデータの所有者になり、BigQuery ACL を使用して、プロジェクトやデータセットの権限を管理できます。

注: アナリティクスから BigQuery にエクスポートしたデータをエクスポートし直すことはできません。

1 日 1 回、すべてのデータのエクスポートが行われます。さらに、データのエクスポートは 1 日を通して継続的に実行されます(詳しくは下記の「ストリーミング エクスポート」をご覧ください)。

BigQuery の無料インスタンス(BigQuery サンドボックス)にエクスポートできますが、サンドボックスの制限を超えるエクスポートを行う場合には料金が発生します

標準プロパティでは、BigQuery Export の 1 日の上限は 100 万イベントです。BigQuery Export のその他の制限に関する詳細

Google アナリティクス インターフェースと BigQuery Export の違い

BigQuery イベント エクスポートでは、未加工のイベントおよびユーザー単位のデータを利用できます。ただし、標準レポートやデータ探索ツールのデータに対し Google アナリティクスが付加した価値は含まれません。このため、BigQuery イベント エクスポート データは、Google アナリティクス インターフェースのデータと異なる場合があります。

BigQuery イベント エクスポートと Google アナリティクスのインターフェースの違いを理解し、可能な限りこれらの違いを小さくする方法について詳しくは、Google アナリティクスの UI と BigQuery Export のギャップを埋めるをご覧ください。

ストリーミング エクスポート

ストリーミング エクスポートは、Google アナリティクス 4 プロパティを BigQuery にリンクした場合に選択できます。

BigQuery ストリーミング エクスポートでは、BigQuery Export を介して当日のデータを数分以内に入手できます。

このエクスポート オプションを使用すると、BigQuery に最新のデータを読み込んで、ユーザーとプロパティのトラフィックを分析できます。

ストリーミング エクスポートでは、次の新しいテーブルが毎日 1 つ作成されます。

  • events_intraday_YYYYMMDD: 内部ステージング テーブルです。このテーブルには、その日に発生したセッション アクティビティのレコードが保持されます。ストリーミング エクスポートはベスト エフォート型の処理であり、イベントの遅れやアップロードの失敗などにより、データに漏れが生じる場合もあります。データは 1 日を通して継続的にエクスポートされます。セッションが複数のエクスポート周期にまたがっていると、テーブルにはそのセッションのレコードが複数保存されることがあります。このテーブルは、events_YYYYMMDD の作成が完了すると削除されます。

BigQuery Export の設定時に日次オプションを選択した場合、次のテーブルも毎日作成されます。

  • events_YYYYMMDD: 1 日に 1 回、すべてのイベントがエクスポートされます。

その日の安定したデータセットを分析できるよう、クエリでは、events_intraday_YYYYMMDD ではなく events_YYYYMMDD を使用するようにしてください。

events_YYYYMMDD テーブルと events_intraday_YYYYMMDD テーブルについて詳しくは、BigQuery Export スキーマをご覧ください。

BigQuery のストリーミング エクスポートには、新規ユーザーについては次のユーザー アトリビューション データは含まれません。

  • traffic_source.name(レポート ディメンション: ユーザーのキャンペーン)
  • traffic_source.source(レポート ディメンション: ユーザーの参照元)
  • traffic_source.medium(レポート ディメンション: ユーザーのメディア)

既存ユーザーのユーザー アトリビューション データは含まれていますが、そのデータの処理が完了するまでには約 24 時間かかります。このため、ユーザー アトリビューション データはストリーミング エクスポートに頼らず、1 日ごとの完全エクスポートから取得することをおすすめします。

ストリーミング エクスポートを使用すると、BigQuery ではデータ 1 GB あたり 0.05 ドルの追加費用が発生します。1 GB は、Google アナリティクスのイベント約 60 万件に相当します(この数は、イベントのサイズによっても異なります)。詳しくは、BigQuery の料金をご覧ください。

テーブルの更新のスケジュール

BigQuery Export の一部として作成されたテーブルの更新は、データのエクスポート元のアナリティクス プロパティのタイムゾーンに則って実施されます。

ストリーミング エクスポートのテーブル(events_intraday_YYYYMMDD)は、1 日を通して継続的に更新されます(例: プロパティのタイムゾーンで、午前 12:00:00 から午後 11:59:59 まで)。プロパティのタイムゾーンで新しい日が始まると、その日の新しいテーブルにイベントが書き込まれます。

日次エクスポートのテーブル(events_YYYYMMDD)は、その日のイベントがすべて収集された後に作成されます。アナリティクスでは、テーブルの日付から最大 72 時間日次テーブルが更新されます。その際、テーブルの日付でタイムスタンプが付いたイベント(例: Measurement Protocol または Firebase SDK から遅れて送信されるイベント バンドル)が使用されます。たとえば、テーブルの日付が 20220101 の場合、20220101 のタイムスタンプが付いたイベントを使用して、20220104 までテーブルが更新されます。

過去のデータの再処理が必要になる場合(処理エラーに対処するバグの修正など)、72 時間が経過した後でも、日次テーブルが随時更新されることがあります。

Cookie のない ping とユーザー提供データ

同意モードが実装されている場合、BigQuery のエクスポートにはアナリティクスで収集された Cookie のない ping が、user_idカスタム ディメンションなどのユーザー提供データとともに含まれます。

「Not Available」のトラフィック ソースのディメンションをバックフィルする

次のリソースを使用して、特定の GCLID のアトリビューション トラフィック ソースのディメンションを検索できます。wBRAID 識別子と gBRAID 識別子は BigQuery Export には含まれません。

  • Google Ads API
  • Google 広告のスクリプト
  • Google 広告用 BigQuery Data Transfer Service

[traffic_source] 列の [Not Available] レコードの GCLID を確認するには、[collected_traffic_source] 列の GCLID フィールドをクエリします。特定の GCLID から Google 広告のキャンペーン情報を検索する方法について詳しくは、BigQuery Export サービスレベル契約をご覧ください。

GA4 - Firebase の統合と BigQuery

GA4 プロパティと Firebase プロジェクトが統合されている場合は、別の BigQuery プロジェクトにリンクすることはできません。

Google アナリティクス 4 とユニバーサル アナリティクスの BigQuery Export の比較

Google アナリティクス 4 ユニバーサル アナリティクス

標準(無料)と 360(有料)で利用可

標準の上限: 1 日あたり 100 万件のイベント

360 の上限: 1 日あたり数十億件のイベント

360(有料)で利用可

費用

BigQuery サンドボックスに無料でエクスポート可(サンドボックスの制限範囲内)

契約の条件に基づき、エクスポートしたデータがサンドボックスの制限範囲を超えると料金が発生

費用

BigQuery サンドボックスに無料でエクスポート可(サンドボックスの制限範囲内)

契約の条件に基づき、エクスポートしたデータがサンドボックスの制限範囲を超えると料金が発生

設定

各プロパティにおける特定のデータ ストリームを追加、および特定のイベントを除外できる

(エクスポートの数と費用をコントロール可)

設定

プロパティごとに 1 個のビューをリンクできる

(そのビューで全データをエクスポート可)

ストリーミング エクスポート

GB あたり $0.05(BigQuery の料金の詳細

作成されるテーブル:

events_intraday_YYYYMMDD

以下の条件でテーブルは毎日削除される:

  • ストリーミングと日次エクスポート オプションを併用している場合
  • 日次テーブルの作成が完了した時点

新規ユーザーに関する「ユーザーのキャンペーン」、「ユーザーの参照元」、「ユーザーのメディア」のデータは含まれない

ストリーミング エクスポート

GB あたり $0.05(BigQuery の料金の詳細

作成されるテーブル:

ga_realtime_sessions_YYYYMMDD

作成される BigQuery ビュー:

ga_realtime_sessions_view_YYYYMMDD

日次エクスポート

作成されるテーブル:

events_YYYYMMDD

日次エクスポート

作成されるテーブル

ga_sessions_intraday_YYYYMMDD

  • 1 日あたり 3 回以上更新される
  • 更新されるたびに以前のデータが上書きされる
  • 翌日からの完全インポートが完了すると削除される

ga_sessions_YYYYMMDD

  • 完全日次インポート

毎日(高頻度)エクスポート

360 プロパティの「標準」と「大」で利用可能

観測されたユーザー アトリビューション データや広告インプレッション データなど、日次エクスポートに含まれるすべてのデータフィールドと列が含まれます。

該当なし

エクスポート、全般

バックフィル: バックフィルなし

データセット: リンクされているプロパティごとに、analytics_<property id> という名前のデータセット 1 個

同意モードを実装している場合、エクスポートに含まれるもの:

  • Cookie のない ping
  • 顧客から提供されたデータ(user_id、カスタム ディメンション)

エクスポート、全般

バックフィル: リンク時に、13 か月分のデータまたは 100 億ヒットのいずれか少ない方

(BigQuery サンドボックスへのバックフィルは失敗する可能性あり)

データセット: リンクされているビューごとに、ビューと同じ名前のデータセット 1 個

エクスポート スキーマ

GA4 では、ユーザーを最初に獲得したトラフィック ソースのみがエクスポートされます

BigQuery にエクスポートされた UA データはサポートされていません

BigQuery テーブルの各行はイベントを表します

Google アナリティクス 4 に固有のイベントデータ

Google アナリティクス 4 の一部のフィールドには、実質的にユニバーサル アナリティクスのフィールドと同じものがありますが(device.categorydevice.deviceCategory など)、GA4 のイベントデータと UA のヒットデータには相違点があります

エクスポート スキーマ

複数のタッチポイントにまたがるセッション単位のアトリビューション

BigQuery テーブルの各行はセッションを表す

ユニバーサル アナリティクスに固有のヒットデータ

ユニバーサル アナリティクスの一部のフィールドには、本質的に Google アナリティクス 4 のフィールドと同じものがありますが(device.deviceCategorydevice.category など)、UA のヒットデータと GA4 のイベントデータには相違点があります

関連資料

次の事項の詳細については、BigQuery のデベロッパー ガイドをご確認ください。

この情報は役に立ちましたか?

改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
メインメニュー
11543720937631176357
true
ヘルプセンターを検索
true
true
true
true
true
69256
false
false