集計

データポータルがデータをグループ化し要約する仕組みを説明します。

集計は、表形式のデータを整理および要約するプロセスです。たとえば、次の数字について考えてみましょう。

100、200、300、400、500
 

この例を基にして、次のように事実と集計の考え方を確認できます。

事実 集計
5 つの数字があります。 件数
最小値は 100 です。 最小
最大値は 500 です。 最大
数字の平均値は 300 です。 平均
合計は 1500 です。 合計

データの集計方法は、この他に「中央値」「個別件数」「四分位」「百分位」などがあります。

ディメンションと集計

上記の例は単一の数字のセットを基にしていますが、現実にはこのようなセットはほとんどありません。そして、データは通常ディメンションと指標に整理されます。ディメンションはデータを分類してグループ化し、指標はそのデータを測定します。

データポータルでは、集計は常にディメンションのセットに対して行われます。ディメンションのセットには、次のものがあります。

  • すべてのディメンション: 元データを表示できます。
  • ディメンションのサブセット: 選択したディメンション別に分類(グループ化)してデータを表示できます。
  • 空のセット: データ全体の概要を表示できます。

たとえば、次の 5 つの数値は、ある 1 日の株価を表しています。日付ティッカーはディメンションで、価格は指標です。

日付 ティッカー 価格
1 月 1 日 GOOG 100
1 月 1 日 AAPL 200
1 月 2 日 GOOG 300
1 月 2 日 AAPL 400
1 月 3 日 GOOG 500


ディメンションを使用することで、データをさまざまに分類してグループ化できます。以下の例をご確認ください。

ティッカー別

ティッカー 価格
GOOG ?
AAPL ?

 

日付別

日付 価格
1 月 1 日 ?
1 月 2 日 ?
1 月 3 日 ?

 

上記の例では、指標の値は表示するデータの内容によって変わります。たとえば、各会社の平均価格を計算するには、平均の集計方法とティッカーのディメンションを組み合わせて適用します。

ティッカー 平均価格
GOOG (100 + 300 + 500) / 3 = 300
AAPL (200 + 400) / 2 = 300

 

ある 1 日の株式情報を公開している会社数を確認するには、日付のディメンションと件数の集計方法を使用します。

日付 株価の件数
1 月 1 日 2
1 月 2 日 2
1 月 3 日 1

 

次に、株価表で日付とティッカーの両方のディメンションを使用した場合の処理について考えてみましょう。

日付 ティッカー AVG(価格) SUM(価格)
1 月 1 日 GOOG 100 100
1 月 1 日 AAPL 200 200
1 月 2 日 GOOG 300 300
1 月 2 日 AAPL 400 400
1 月 3 日 GOOG 500 500

 

使用可能なすべてのディメンションを含むグループを作成すると、結果は元のデータと同じになります。すべての集計結果が同じになるため、興味深い内容ではありませんが、これも集計値です データポータルでは、表を作成してすべてのディメンションを表示した場合でも集計方法を設定できますが、何も起きません。

データポータルの集計

データポータルのデータに集計メソッドを適用する方法はいくつかあります。

データソース内で適用する。フィールドのデフォルトの集計プロパティにより、グラフでの指標の表示方法が決まります。デフォルトの集計については、以下をご確認ください。

グラフ内で適用する。レポートの編集者は、デフォルトの集計をオーバーライドして、グラフごとに別の集計を指標に適用できます。詳しくは、グラフのデータを追加、編集する方法をご確認ください。

計算フィールドで適用する。計算フィールドの数式内の特定の集計関数を使用して集計指標を作成できます。詳しくは、関数のリストをご確認ください。

デフォルトの集計

データソースのフィールドには、次のデフォルトの集計を適用できます。

集計方法 説明
Sum(合計) フィールド値はまとめて加算されます。
Average(平均) フィールド値が平均化されます。
Count(件数) すべての値がカウントされます。
Count Distinct(個別件数) ユニークな値のみがカウントされます。
Min(最小) フィールドに最小値が表示されます。
Max(最大) フィールドに最大値が表示されます。
Auto(自動) 直接適用することはできません。集計メソッドは、基になるデータセットまたは計算フィールドの結果として指定されます。

自動集計方法は変更できません。

なし 集計は適用されません。このフィールドは、数値データが含まれていてもディメンションとして扱われます。

このメソッドはデータソースにのみ表示されます。レポートの指標のデフォルトの集計は「Sum」です。

集計方法を変更する

フィールドの集計方法を変更するには、データソースを編集し、[デフォルトの集計] プルダウン メニューを使用します。

自動集計

アナリティクスや Google 広告など一部のデータソースでは、自動集計が指標に対して使用可能な唯一の集計方法として表示されます。これらのデータはすでに集計されているため、大量の数値のリストが 1 つの値にまとめられます。使用される集計方法には、「SUM」や「件数」などのシンプルなものや、「パーセンタイル」などの複雑なものがあります。自動集計された指標を別の集計方法に変更することはできません。変更には、データポータルが未集計の元データにアクセスする必要があるためです。

また、自動集計は、スプレッドシートなどの他のデータソースに基づく計算フィールドに適用されます。この場合、集計値は AVG(価格) などの集計関数を使用した結果になります。前述のとおり、AVG 関数の結果と競合するため、自動集計を変更することはできませんのでご注意ください。

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。