統合に関するヒントと高度な概念

この記事では、より複雑なユースケースの解決に役立つ統合の仕組みについて詳しく説明します。

この記事の内容:

統合に関するヒント

使用可能なデータのサブセットのみを統合に含める必要がある

ベスト プラクティスとして、統合に基づくグラフで可視化する特定のフィールドのみを含めることをおすすめします。その理由は次のとおりです。

  • 統合を行うと、非常に大きなデータセットが作成され、BigQuery などの有料サービスでのパフォーマンス低下やクエリ費用の増加につながることがあります。
  • 統合に基づくグラフでは、グラフ内で未使用であっても、統合内のすべての行が計算されます。
    • たとえば、10 個のフィールドを含む統合を作成し、そのうち 1 個のフィールドのみを使用するグラフを定義するとします。データポータルは 10 個のフィールドを含む統合を計算し、統合の出力内にあるその 1 個のフィールドをクエリしてグラフを作成します。
    • 再集計は、基になるデータのサブセットが統合に含まれている場合にのみ行われます(これについても後述します)。

同じデータソースの複数のテーブルを統合する

同じデータソースから複数のテーブルを統合すると、データを自由に組み合わせて、コネクタの制限を回避することができます。

たとえば、ユニバーサル アナリティクス コネクタには「1 日のアクティブ ユーザー数」、「7 日間のアクティブ ユーザー数」、「28 日間のアクティブ ユーザー数」という指標がありますが、アナリティクスの制限により、グラフにはこれらの指標のうち 1 つしか追加することができません。しかし、データポータル内で同じアナリティクス データソース同士を結合すれば、アクティブ ユーザー数の各指標を統合に含めて、1 つのグラフ上で比較することができます。

高度な概念

統合内のテーブルの順序

データポータルでは、統合内の結合設定が左端から順に評価されます。それから、右側にある次の結合に各結合の結果が適用されます。たとえば 3 つのテーブルの統合の場合、テーブル 1(左端)とテーブル 2(中央)間の結合設定が評価され、次に、その結果がテーブル 2 とテーブル 3(右端)間の結合設定で使用されます。

自動作成された統合のテーブルの順序

選択したグラフを統合すると、データポータルによってグラフごとにテーブルが作成され、対応するテーブルにグラフ内のフィールドが追加されます。統合内のテーブルの順序は、グラフを選択する順序と一致します。つまり、最初に選択したグラフが最初(左端)のテーブルになり、2 番目に選択したグラフが 2 番目のテーブルになるということです。

また、データポータルでは各テーブルの結合設定が自動的に作成され、左外部結合タイプが使用されます。

デフォルト設定が意図したとおりになっていない場合や、テーブル間に明確な関連付けがない場合は、目標に合わせて統合を編集できます。

テーブルは統合の前に作成される

統合内の各テーブルのデータは、そのデータが最終統合に結合される前にクエリされます。つまり、結合が実行される前に、テーブルを生成するクエリに対してテーブルの期間、フィルタ、計算フィールドが適用されるということです。これにより、統合テーブルに含まれるデータが影響を受け、統合の出力が変更される場合があります。

統合すると指標が再集計される

基になるデータソースから含めた指標の数値は、統合では集計されません。基になるデータソースのフィールド セットの一部が統合に含まれていない場合、これらの数値は新しいデータに基づいて再集計されます。これは、平均の平均の計算など、すでに集計されているフィールドに別の集計を適用する必要がある場合に役立ちます。

再集計の詳細

統合すると元のデータよりも多くの行が含まれる場合がある

統合グラフには、統合を構成する個々のデータソースに基づくグラフよりも多くのデータが表示されることがあります。これは、データと、統合に選択した結合設定によって異なります。たとえば、左外部結合には、左側のテーブルにあるすべてのレコードと、結合条件で同じ値を共有する右側のテーブルのレコードすべてが含まれています。結合条件に一致が複数ある場合、統合データには一番左のデータソースにあるよりも多くの行が表示される可能性があります。

クロス結合では常に、個々のデータソース内の行の合計よりも多くの行が返されます。その場合、グラフで「要求されたデータが多すぎます」のエラーが発生することがあります。

統合と明示的な期間およびフィルタ

統合内の行数を制限するには、期間の使用またはフィルタの適用という 2 つの方法があります。これは、統合に基づくグラフ、または統合を構成するテーブルで行うことができます。この仕組みを理解するには、「統合前」と「統合後」のどちらであるかを考えると参考になります。

期間またはフィルタを統合内のテーブルに適用した場合は、統合内の他のテーブルと統合する前に反映されます。期間外の行や、フィルタによって除外された行には、結合クエリを適用できません。

統合に基づくグラフに期間やフィルタを適用する場合は、統合が作成された後(「統合後」)にデータに適用されます。

この違いは、データと統合の設定によっては、グラフに表示される結果に大きく影響する場合があります。

統合と継承フィルタ

統合では、統合前または統合後のデータとフィルタとの互換性がある限り、レポート、ページ、またはグループ単位のフィルタが継承されます。統合で使用される基となるデータソースとの互換性がある場合、そのフィルタは統合前のデータに適用されます。それ以外の場合、フィルタは統合後のデータに適用されます。統合前または統合後のデータとの互換性がない場合には、そのフィルタは無視されます。

詳しくは、フィルタの継承をご覧ください。

統合に基づくグラフが継承フィルタの適用対象である場合、データポータルでは、データが 5 段階のステップで処理されます。

(統合前)

  • ステップ 1: データが [データの統合] パネルで指定されたディメンションに基づいてグループ化され、集計されます。
  • ステップ 2: 継承されたディメンション フィルタおよび互換性のある指標フィルタが、[データの統合] パネルに含まれるデータソースに適用されます。

(統合)

  • ステップ 3: データが指定された結合設定を使って統合されます。

(統合後)

  • ステップ 4: データがグラフのディメンションに基づいてグループ化され、集計されます。
  • ステップ 5: 統合データと互換性のある指標フィルタが、グラフに適用されます。
この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
102097
false
false