集計は、表形式のデータを整理および要約するプロセスです。たとえば、次の数字について考えてみましょう。
100、200、300、400、500
この例を基にして、次のように事実と集計の考え方を確認できます。
事実 | 集計 |
---|---|
5 つの数字があります。 | 件数 |
最小値は 100 です。 | 最小 |
最大値は 500 です。 | 最大 |
数字の平均値は 300 です。 | 平均 |
合計は 1500 です。 | 合計 |
データの集計方法は、この他に「中央値」「個別件数」「四分位」「百分位」などがあります。
ディメンションと集計
上記の例は単一の数字のセットを基にしていますが、現実にはこのようなセットはほとんどありません。そして、データは通常ディメンションと指標に整理されます。ディメンションはデータを分類してグループ化し、指標はそのデータを測定します。
Looker Studio では、集計は常にディメンションのセットに対して行われます。ディメンションのセットには、次のものがあります。
- すべてのディメンション: 元データを表示できます。
- ディメンションのサブセット: 選択したディメンション別に分類(グループ化)してデータを表示できます。
- 空のセット: データ全体の概要を表示できます。
たとえば、次の 5 つの数値は、ある 1 日の株価を表しています。日付とティッカーはディメンションで、価格は指標です。
日付 | ティッカー | 価格 |
1 月 1 日 | GOOG | 100 |
1 月 1 日 | AAPL | 200 |
1 月 2 日 | GOOG | 300 |
1 月 2 日 | AAPL | 400 |
1 月 3 日 | GOOG | 500 |
ディメンションを使用することで、データをさまざまに分類してグループ化できます。例:
ティッカー別
ティッカー | 価格 |
GOOG | ? |
AAPL | ? |
日付別
日付 | 価格 |
1 月 1 日 | ? |
1 月 2 日 | ? |
1 月 3 日 | ? |
上記の例では、指標の値は表示するデータの内容によって変わります。たとえば、各会社の平均価格を計算するには、平均の集計方法とティッカーのディメンションを組み合わせて適用します。
ティッカー | 平均価格 |
GOOG | (100 + 300 + 500) / 3 = 300 |
AAPL | (200 + 400) / 2 = 300 |
ある 1 日の株式情報を公開している会社数を確認するには、日付のディメンションと件数の集計方法を使用します。
日付 | 株価の件数 |
1 月 1 日 | 2 |
1 月 2 日 | 2 |
1 月 3 日 | 1 |
次に、株価表で日付とティッカーの両方のディメンションを使用した場合の処理について考えてみましょう。
日付 | ティッカー | AVG(価格) | SUM(価格) |
1 月 1 日 | GOOG | 100 | 100 |
1 月 1 日 | AAPL | 200 | 200 |
1 月 2 日 | GOOG | 300 | 300 |
1 月 2 日 | AAPL | 400 | 400 |
1 月 3 日 | GOOG | 500 | 500 |
使用可能なすべてのディメンションを含むグループを作成すると、結果は元のデータと同じになります。すべての集計結果が同じになるため、興味深い内容ではありませんが、これも集計値です。 Looker Studio では、表を作成してすべてのディメンションを表示した場合でも集計方法を設定できますが、何も起きません。
Looker Studio の集計
Looker Studio のデータに集計メソッドを適用する方法はいくつかあります。
データソース内で適用する。フィールドのデフォルトの集計により、グラフでの指標の表示方法が決まります。デフォルトの集計については、以下をご確認ください。
グラフ内で適用する。レポートの編集者は、デフォルトの集計をオーバーライドして、グラフごとに別の集計を指標に適用できます。詳しくは、グラフのデータを追加、編集する方法をご確認ください。
計算フィールド内で適用する。計算フィールドの数式内の特定の集計関数を使用して集計指標を作成できます。詳しくは、関数のリストをご確認ください。
デフォルトの集計
データソースのフィールドには、次のデフォルトの集計を適用できます。
集計方法 | 略語 | 説明 |
---|---|---|
Sum | SUM | フィールド値はまとめて加算されます。 |
Average | AVG | フィールド値が平均化されます。 |
Count | CT | すべてのフィールドの値がカウントされます。 |
Count Distinct | CTD | 一意のフィールド値のみカウントされます。 |
Min | MIN | フィールドに最小値が表示されます。 |
Max | MAX | フィールドに最大値が表示されます。 |
Auto | AUT | この方法を直接適用することはできません。集計方法は、基になるデータセットまたは計算フィールドの結果として指定されます。
自動集計方法は変更できません。 |
なし |
集計は適用されません。このフィールドは、数値データが含まれていてもディメンションとして扱われます。 注: この方法はデータソースにのみ表示されます。レポートの指標のデフォルトの集計は「Sum」です。
|
集計方法を変更する
フィールドの集計方法を変更するには、データソースを編集し、[デフォルトの集計] プルダウン メニューを使用します。
自動集計
Google アナリティクスや Google 広告など一部のデータソースでは、自動集計が指標に対して使用可能な唯一の集計方法として表示されます。これらのデータはすでに集計されているため、大量の数値のリストが 1 つの値にまとめられます。使用される集計方法には、「SUM」や「件数」などのシンプルなものや、「パーセンタイル」などの複雑なものがあります。自動集計された指標を別の集計方法に変更することはできません。変更するには、Looker Studio が未集計の元データにアクセスする必要があるためです。
また、自動集計は、スプレッドシートなどの他のデータソースに基づく計算フィールドに適用されます。この場合、集計値は AVG(価格)
などの集計関数を使用した結果になります。前述のとおり、AVG 関数の結果と競合するため、自動集計を変更することはできませんのでご注意ください。