散布図を使用すると、複数の変数の関連性が分かります。散布図は特に、データから明らかになった傾向とパターンを理解するのに役立ちます。散布図を使って、データ内の外れ値を特定することもできます。
データに相関する 2 つの変数が含まれている場合、相関関係を見つけて調べるには散布図を使ってデータを可視化するとよいでしょう。変数 x が増加すると変数 y も増加するプラスの相関関係になる場合や、一方の変数が増加して他方の変数は減少するマイナスの相関関係になる場合もあります。選択された 2 つの変数の間に相関がない場合、相関が null になることもあります。データの潜在的な相関関係を認識することで、データに関するより深い洞察を得ることができ、将来のデータ行動を予測することさえ可能になります。
この記事の内容:Looker Studio の散布図
Looker Studio で散布図を設定するには、グラフの横軸(X)と縦軸(Y)の指標を選択します。最大 3 つのディメンションをグラフに追加することで、データをグループ化できます。たとえば、散布図を使って、国ごとの広告費用とコンバージョン率に相関関係があるかどうかを地域と広告キャンペーン別に確認できます。そうすることで、「広告費用をかければコンバージョン率が高くなるのか」といった疑問に答えることができます。
トレンドとパターンを見つけ、データの外れ値を特定するには、トレンドラインを追加します。トレンドラインの全体的な傾斜の向きによって、変数間の関係(「相関関係」)を把握できます。たとえば、傾斜が左から右へと上昇している場合は、プラスの相関関係を示しています。つまり、X の値が大きくなるほど Y の値も大きくなるという関係です。一方、傾斜が左上から右下へと下降している場合は、マイナスの相関関係を意味します。つまり、X の値が大きくなるほど Y の値が小さくなるという関係です。傾斜がない場合は、変数間に相関関係がほとんどないか、まったくないということです。また、データポイントがトレンドラインに近いほど、密接な相関関係があります。
散布図の例
下の散布図では、架空のオンライン大学の実績が 2 種類の方法で表示されています。左のグラフでは、平均講座修了率と平均活動率(フォーラムへの投稿や講義の受講など、学生の利用状況を測定した指標)を比較しています。このグラフでは、線形のトレンドラインが左から右へと上昇しています。これは、活動率と修了率がプラスの相関関係にあること、つまり、このオンライン大学に意欲的に取り組んでいる学生ほど講座を修了する可能性が高いことを示しています。
右のグラフでは、平均成績と宿題にかかった時間を講座ごとに比較しています。このグラフのトレンドラインは左から右へと下降しています。これは指標がマイナスの相関関係にあること、つまり宿題にかかった時間が短いほど平均成績は高くなることを示しています。
右のグラフでは、外れ値を示している講座が 2 つあることも把握できます。左下の講座については、宿題にかかった時間が短いのに平均成績も低くなっています。一方、上の方に表示されている講座については、宿題にかかった時間が最も長いものの、平均成績は 3.0 近くを記録しています(ご自身のグラフでも、外れ値について標準に適合しない原因があるかどうか確認することをおすすめします)。
その他の散布図
基本的な散布図に加えて、あらかじめ設定されたバブルチャートをツールバーから追加することもできます。
バブルチャート
バブルチャートにはバブルのサイズの指標が含まれます。これは、X 軸または Y 軸の指標と同じ指標でも、異なる指標でもかまいません。指標の値が大きいほど、バブルも大きくなります。
バブル チャートの例
このバブルチャートは、2021 年の国立公園(米国カリフォルニア州のピナクルズ国立公園)への訪問数を可視化したものです。各バブルは特定の月を表します。グラフ内の各バブルの位置は、訪問者数と各月の訪問者の滞在時間を表します。このグラフでは、recall_visitors 指標を使用してバブルのサイズを決定しています。
グラフデータを設定する
[プロパティ] パネルの [設定] タブにあるオプションを使用すると、グラフのデータの構成方法と表示方法を指定できます。
データソース
データソースはコンポーネントと基になるデータセットを接続します。
- グラフのデータソースを変更するには、現在のデータソース名をクリックします。
- データソースを表示または編集するには、 をクリックします(このアイコンを表示するには、閲覧権限以上の権限が必要です)。
- 複数のデータソースからのデータを 1 つのグラフに表示するには、[+ データの統合] をクリックします。データの統合機能の詳細
ディメンション
ディメンションとは、データのカテゴリのことです。ディメンション値(ディメンションに含まれるデータ)は、名前や説明など、カテゴリの特性を表します。
期間のディメンション
このオプションは、データソースに有効な日付ディメンションがある場合に表示されます。
注: Google 広告または Google アナリティクスのデータソースでは、自動的にデータソースの日付型のディメンションが選択されるため、このオプションは表示されません。
「期間」ディメンションは、グラフの期間を指定する際の基準となります。グラフの期間のプロパティを設定する場合や、レポートの閲覧者が期間設定を使って期間を指定する場合などに使用されます。
ドリルダウン
このオプションは、ドリルダウンをサポートするグラフに表示されます。
グラフをドリルダウンすると、データをより詳しく把握することができます。[ドリルダウン] オプションを有効にすると、追加するディメンションごとにさらに掘り下げて調査できます。グラフのドリルダウンの詳細
指標
指標は、ディメンションに含まれる要素を測定し、グラフの数値目盛りとデータ系列を指定します。
指標は、基盤となるデータセットから算出された集計値、または COUNT()
、SUM()
、AVG()
などの集計関数を暗黙的または明示的に適用した結果を示します。指標自体には定義済みの一連の値がないため、ディメンションの場合とは異なり、指標でグループ化することはできません。
指標オプション
指標 X | X(横)軸の指標です(右上の例では「平均成績」です)。 |
指標 Y | Y(縦)軸の指標です。右上の例では「宿題にかかった時間」です)。 |
バブルのサイズの指標 | これを設定すると、グラフがバブルチャートとして表示されます。この指標でデータポイントのサイズが決まります。 |
指標スライダー
レポート ユーザーは、指標の値でグラフまたは表をフィルタリングできます。指標スライダーの詳細
デフォルトの並べ替えを設定する
グラフの設定パネルの [並べ替え] オプションと [サブの並べ替え] オプションを使用して、デフォルトの並べ替え順を設定します。グラフのデータソースの指標や、グラフに現在表示されているディメンションを選択し、メインまたはサブの並べ替えフィールドとして使用できます。
デフォルトの期間
デフォルトの期間のプロパティでは、個々のグラフの期間を設定できます。
デフォルトの期間のオプション
自動 | グラフのデータソースで設定されているデフォルトの期間を使用します。 |
カスタム | カレンダー ウィジェットを使用して、グラフのカスタムの期間を選択できます。 |
データ比較タイプ | 選択した期間の比較データを表示します。 |
フィルタ
フィルタでは、追加または除外する値を指定することでコンポーネントに表示されるデータを制御できます。フィルタ プロパティの詳細
フィルタ オプション
フィルタ名 | 既存のフィルタをクリックして編集します。削除するには、フィルタ名にカーソルを合わせて X をクリックします。 |
+ フィルタを追加 | グラフのフィルタを新しく作成するには、このオプションをクリックします。 |
グラフ インタラクション
グラフで [クロス フィルタリング] オプションを有効にすると、そのグラフを介してフィルタ オプションを使用できます。レポートをフィルタリングするには、グラフ上でマウスをクリックまたはブラッシングします。クロス フィルタリングの詳細
[ズーム] オプションを使用すると、グラフにズームインし、グラフをパンして、存在するすべてのデータを表示できます。座標型のグラフのズームとパンに関する詳細
[スタイル] タブのオプションでは、グラフの全体的な外観と表示形式を設定します。
データラベルを表示 | この系列の各データポイントに対し、個々の値を表示します。 |
バブルの色 | グラフ内のデータポイントの色付けに使用するディメンションを設定します。[なし] に設定すると、バブルは単色で表示されます。ディメンションを選択すると、グラフが複数の色で表示されます。 |
バブル数 | 表示するデータポイントの数を決めます。ディメンションの値の数がこの数を超えると、上位 N 個の値のみ表示されます。 |
配色
データの配色方法を指定します。詳しくは、レポートの色を設定する方法をご覧ください。
ディメンション値 |
このオプションでは、ディメンション値のカラーマップに指定された色で、グラフの各ディメンション値を色付けします。このオプションを使用すると、グラフ内の位置に関係なく、同じデータには常に同じ色が使用されます。 |
基準線
基準線または基準帯域をグラフに追加するには、[基準線を追加] または [基準帯域を追加] を選択します。
基準線と基準帯域について詳しくは、グラフに基準線と基準帯域を追加する方法に関するページをご覧ください。
トレンドライン
トレンドラインはグラフに重ねて表示することが可能で、データの全体的な傾向を明らかにします。Looker Studio では、いくつかの種類のトレンドラインがサポートされており、これらは [トレンドライン] プルダウン メニューから選択できます。
-
線形
線形トレンドラインは、グラフのデータに最も近い直線です(正確には、すべてのポイントからの距離の 2 乗の合計を最小にする線です)。 - 多項式
多項式トレンドラインでは、曲線を使ってデータの傾向を表します。これは、大規模でばらつきの大きいデータ系列を分析する際に役立ちます。
- 指数
指数トレンドラインでは、最適な eax+b の指数形式でデータの傾向が表されます。
- 移動平均
移動平均トレンドラインを使用すると、グラフ上のデータの移動平均計算を視覚化できます。移動平均トレンドラインを選択する場合は、計算の期間を指定します。
[移動平均] トレンドラインのタイプは、期間グラフでのみ使用できます。
[トレンドライン] プルダウン メニューからオプションを選択すると、トレンドラインの [太さ]、[スタイル]、[色] を設定するオプションが表示されます。
ズーム
プロパティ パネルの [設定] タブでグラフの [ズーム] オプションを有効にすると、次のいずれかのオプションを選択できます。
- クリック&ドラッグでズーム: 可視化の拡大する部分をクリックおよびドラッグして選択し、ズームします。
- スクロールでズーム: マウスでスクロールしてズームします。
必要に応じて、[X 軸のみをパンまたはズーム] チェックボックスをオンにすると、X 軸に沿ったズームとパンのみが許可されます。
軸
このオプションでは、グラフの軸のタイトルと目盛の表示形式を設定します。グラフに複数の指標がある場合は、右側の Y 軸のセクションが表示されます。
軸オプション
軸を表示する | グラフの軸の表示 / 非表示を切り替えます。 |
Y 軸を逆方向にする | Y 軸の垂直表示を制御します。 |
X 軸を逆方向にする | X 軸の水平表示を制御します。 |
左 Y 軸
グラフ左側の Y 軸の表示形式を設定します。グラフに複数の指標がある場合は、右側の Y 軸のセクションが表示されます。
軸オプション
軸タイトルを表示 | 軸ラベルの表示 / 非表示を切り替えます。 | |
軸の最小値と最大値 | 軸の最小値と最大値を設定します。 | |
カスタム目盛り間隔 | 軸の目盛りの間隔を制御します。 | |
対数目盛 | 軸の目盛りを対数に設定します。 |
X 軸
グラフの X 軸の表示形式を設定します。
軸オプション
凡例
グラフの凡例の配置場所を設定します。
凡例のフォント色 | 凡例のフォントの色を設定します。 |
フォントサイズ | 凡例のフォントのサイズを設定します。 |
フォント ファミリー | 凡例のフォントのフォントタイプを設定します。 |
なし |
凡例は表示されません。 |
右側 | 凡例は右側に表示されます。 |
下部 | 凡例は下部に表示されます。 |
上部 | 凡例は上部に表示されます。 |
配置 | 選択した位置を基準にして凡例の配置を設定します。 |
最大行数 | 凡例が使用する行数を設定します。系列数が行数よりも多い場合は、< と > の矢印をクリックすると、隠れている項目を表示できます。 この設定は、凡例が [上] に設定されている場合にのみ適用されます。凡例が [右] または [下] に設定されている場合、この設定は適用されません。 |
グリッド
グラフのグリッドの表示形式を設定します。
軸の色 | 軸線の色を設定します。 | |
グリッド線の色 | グリッド線の色を設定します。 | |
フォント ファミリー | グリッド線のテキストのフォントタイプを設定します。 | |
軸のフォントサイズ | グリッド線のテキストのフォントサイズを設定します。 | |
ラベルのフォントサイズ | グリッド線のラベルテキストのフォントサイズを設定します。 | |
グラフの背景 | グラフの背景色を設定します。 | |
グラフの枠線の色 | グラフの内側の枠線の色を設定します。 |
背景と枠線
グラフの背景コンテナの表示形式を設定します。
背景 | グラフの背景色を設定します。 |
枠線の角丸半径 | グラフの背景に角丸の枠線を追加します。半径を 0 にすると、背景の角が 90° になります。枠線の角丸半径を 100° にすると、角が丸くなります。 |
不透明度 | グラフの不透明度を設定します。不透明度を 100% に設定すると、対象物がグラフの背後に隠れます。0% に設定すると、グラフが非表示になります。 |
枠線の色 | グラフの枠線の色を設定します。 |
枠線の太さ | グラフの枠線の太さを設定します。 |
枠線スタイル | グラフの枠線のスタイルを設定します。 |
枠線に影を付ける | グラフの下側と右側の枠線に影を追加します。 |
グラフのヘッダー
グラフのヘッダーでは、データのエクスポート、ドリルアップ、ドリルダウン、グラフの並べ替えなど、グラフに対してさまざまな操作を実行できます。グラフのヘッダーのオプションは次のとおりです。
カーソルを合わせて表示(デフォルト) | グラフのヘッダーにカーソルを合わせると、縦に 3 つ並んだ点が表示されます。これらの点をクリックしてヘッダーのオプションにアクセスします。 |
常に表示 | ヘッダーのオプションを常に表示します。 |
表示しない | ヘッダーのオプションを表示しません。レポートの閲覧者は、いつでもグラフを右クリックしてオプションにアクセスできます。 |
色 | グラフのヘッダーのオプションの色を設定します。 |