統合の仕組み

データの統合の背後にある基本的なコンセプトを理解します。

データを統合すると、複数のデータソースに基づくグラフ、テーブル、コントロールを作成できます。

たとえば、異なる BigQuery テーブル(例: 顧客情報と注文詳細)のデータを統合して、データポータルで 1 つのテーブルを作成して情報を視覚化できます。別の例として、Google 広告アカウントとアナリティクス アカウントのデータを組み合わせて時系列で表示して、マーケティング キャンペーンのパフーマンスの全体像を把握することも可能です。

ヒント: データの統合は複雑な作業となることがあるため、この記事で紹介する機能を活用するには、次について理解しておきましょう。

統合とデータソースの違い

データを統合すると、「統合」と呼ばれるリソースが作成されます。統合は、レポートのグラフとコントロールにデータを提供するという点で、データソースと似ています。ただし、結合とデータソースにはいくつかの重要な違いがあります。

  • 結合は、複数のデータソースから情報を取得します。
  • 結合は、作成元のレポートに常に埋め込まれます。他のレポートで統合を再利用することはできません。ただし、レポートをコピーすると、新しいレポートに統合もコピーされるため、統合データがグラフに引き続き反映されます。
  • 基となるデータソースの指標は、統合では数値ディメンションとなり、集計されません。詳しくは、高度な概念についての記事をご覧ください。
  • 統合では、独自のデータ更新頻度や認証情報を設定できません。この設定は基となるデータソースから継承されます。

統合の仕組み

データベースのプログラミングでは、異なるテーブルのデータを統合するために SQL の JOIN ステートメントを使用しますが、データポータルでは代わりに統合エディタを使用するため、コードを記述することなくデータを統合することができます(以下のスクリーンショット参照)。

番号振りをした統合エディタ

統合エディタ。

凡例:

  1. テーブル
  2. 使用可能な項目のリスト
  3. 結合の設定
  4. 別のテーブルを結合する
  5. 統合名
  6. 含まれている項目のリスト
  7. [保存] ボタン

テーブル

統合は複数のテーブルで構成されます。統合を編集または作成すると、管理画面にテーブルが表示されます。各テーブルには、基になるデータソースから抽出された一連のフィールドが含まれています。1 つの統合に、テーブルは最大 5 つまで追加できます。

テーブルにデータを追加するには、Chevron right icon. をクリックして [使用可能な項目] のリストを開きます。

結合条件で使用されるフィールドは、リンクアイコン 結合条件のフィールドを示すために使用されるリンクアイコン 付きで表示されます。

結合の設定

「結合の設定」で、テーブルのペアを結合して統合します。「結合の設定」は、演算子(テーブルのペアから一致するレコードと一致しないレコードの組み合わせ方法を定義する)と、条件(テーブルの相互関連を定義するフィールドのセット)で構成されています。

たとえば、次のスクリーンショットでは、「Grades(成績)」テーブルが「Students(学生)」テーブル student_id フィールドと、「Classes(クラス)」テーブルの class_id フィールドに結合されています。どちらの「結合の設定」でも、左外部演算子が使用されています。

student_id に基づいて Grades を Students に結合する左外部結合設定の例

結合の設定の例(左外部結合演算子を結合演算子、student_id を結合条件として使用)。

結合演算子

結合演算子は、統合内のテーブルの一致する行と一致しない行の結合方法を定義します。データポータルは、次の結合演算子をサポートしています。

    • 内部結合 - 左右両方のテーブルの条件が一致した行のみを返します。
    • 左外部結合 - 右側のテーブルの条件が一致した行と、左側のテーブルのすべての行を返します。
    • 右外部結合 - 左側のテーブルの条件が一致した行と、右側のテーブルのすべての行を返します。
    • 完全外部結合 - 左右両方のテーブルからすべての行を返します。
    • クロス結合 - 左右両方のテーブルから考えられるすべての行の組み合わせを返します。

結合演算子について詳しくは、BigQuery のドキュメントをご覧ください。

結合条件

「結合条件」とは、各テーブルにある 1 つ以上のフィールドのことで、テーブルのレコードを結合するために使用されます。たとえば、Google アナリティクスと Google 広告のグラフの統合で、抽出された両方のテーブルにキャンペーン名が存在する場合、そのフィールドを使用してデータを結合します。

統合のテーブルごとに、条件に使用するフィールドを選択します。すべてのテーブルに同じフィールドを使用する必要はありません。また、フィールド内でデータが同じであれば、同じ名前である必要もありません。たとえば、顧客、注文、商品アイテムを 1 つのグラフで視覚化するとします。これらのテーブルには次のようなフィールドがあります。

顧客のテーブル

  • customer_ID
  • customer_name

注文のテーブル

  • cust_id
  • order_number
  • order_total

商品アイテムのテーブル

  • order_number
  • SKU

これらのテーブルを統合するには、customer_ID フィールドと cust_id フィールドを結合条件として使用して顧客テーブルと注文テーブルを結合します。order_number を結合条件として注文テーブルを商品アイテム テーブルと結合します。

: データポータルでは、結合条件のフィールド間の等価性のみがサポートされています。たとえば、フィールド A = フィールド Bの結合条件を作成できますが、フィールド A ≠ フィールド B、フィールド A >フィールド B、フィールド A < フィールド B などは作成できません。

統合の例

この概念の実例については、クラス、生徒、成績の統合例をご覧ください。

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
102097
false
false