Google の BigQuery は、低料金でペタバイトの規模を誇るフルマネージド型の分析データ ウェアハウスです。Looker Studio の BigQuery コネクタを使用して、Looker Studio から BigQuery テーブルのデータにアクセスできます。
BigQuery に接続する方法
Looker Studio は、Google BigQuery の単一のテーブルまたはビュー、あるいはカスタムクエリに接続できます。以下の手順でコネクタを選択するように求められたら、[BigQuery] コネクタを選択します。
接続を行うための手順
データに接続するには、新しい埋め込みデータソースを作成するか、既存の(再利用可能な)データソースを選択します。
埋め込みデータソースと再利用可能なデータソースの比較
データソースは、埋め込みデータソースか再利用可能なデータソースのいずれかになります。レポートには、埋め込みデータソースと再利用可能なデータソースの両方を使用できます。
レポートの編集中に作成したデータソースは、レポート内に埋め込まれます。埋め込みデータソースを編集するには、そのレポート内で編集する必要があります。埋め込みデータソースを使用すると、レポートとデータソースの共同編集がよりスムーズに行えるようになります。レポートを編集できるユーザーであれば、データソースの編集と接続の変更も可能です。レポートを共有またはコピーした場合、埋め込まれているデータソースも共有またはコピーされます。
ホームページから作成するデータソースは再利用できます。これらのデータソースはさまざまなレポートで再利用でき、再利用可能なデータソースを使用すれば、組織全体で一貫したデータモデルを作成して共有できます。再利用可能なデータソースを編集できるのは共有相手のみで、接続を変更できるのはデータソースの認証情報のオーナーのみです。
詳しくは、データソースについてをご覧ください。
- Looker Studio にログインします。
- 左上にある
[作成] をクリックして、[レポート] を選択します。
- レポート エディタが表示され、[データのレポートへの追加] パネルが開きます。
- 新しい埋め込みデータソースを作成するには、コネクタを選択します。
-
再利用可能な既存のデータソースを選択するには、[マイ データソース] タブをクリックし、以前に作成したデータソースまたは共有されているデータソースを選択します。必要に応じて、そのデータソースのデータセットへの接続を編集できます。
-
- データセットへの接続を構成します。以降のセクションでは、接続のオプションについて詳しく説明します。
- 右下の [追加] をクリックします。
しばらくすると、データソースのフィールドを含むテーブルがレポートのキャンバスに表示されます。キャンバスの右側にあるプロパティ パネルから、テーブルのデータやスタイルを変更できます。キャンバスの上部にあるツールバーを使って、レポートにグラフやコントロールなどのコンポーネントを追加することも可能です。
Looker Studio を初めてご利用の場合
レポート作成のチュートリアル、またはレポート エディタに関する記事をご覧ください。
データソースの接続を構成する
プロジェクトを選択する
プロジェクトでは BigQuery リソースが整理され、レポートが BigQuery の無料割り当てを超過した場合に課金が行われます。課金とデータ管理の両方に同じプロジェクトを使用したり、1 つのプロジェクトをデータ用に使用し、別のプロジェクトで課金を行ったりすることもできます。詳しくは、Google Cloud プロジェクトをご覧ください。
次のいずれかのオプションを選択して、プロジェクトを選択します。
最近のプロジェクト
このオプションを使用すると、最近 Google Cloud コンソールでアクセスしたプロジェクトを見つけることができます。プロジェクト ID を手動で入力することもできます。選択したプロジェクトは、課金とデータアクセスの両方に使用されます。プロジェクトを選択したら、データセットを選択します。
マイ プロジェクト
このオプションを使用すると、アクセス権があるプロジェクトを選択することができます。プロジェクト ID を手動で入力することもできます。選択したプロジェクトは、課金とデータアクセスの両方に使用されます。プロジェクトを選択したら、データセットを選択します。
共有プロジェクト
共有プロジェクトにアクセスするには、このオプションを使用します。必要に応じて、データと課金に異なるプロジェクトを選択できます。プロジェクトを選択したら、データセットを選択します。
カスタムクエリ
カスタムクエリの課金プロジェクトを指定するには、このオプションを使用します。データへのアクセスには、同じプロジェクトを使用することも、別のプロジェクトを使用することもできます。課金プロジェクトを選択したら、クエリを作成します。このクエリでは、以下のスクリーンショットに示すように、FROM 句でデータ用に別のプロジェクトを指定できます。
一般公開データセット
BigQuery の一般公開データセットにアクセスするには、このオプションを使用します。BigQuery では、プロジェクトではなく、データセットが共有される公開サンプルを多数用意しています。このデータに対してクエリを実行するには、独自の課金プロジェクトを指定する必要があります。ここで選択したプロジェクトが、共有データにおける処理費用の請求に使用されます。
データセットを選択する
データセットは、データの整理とデータアクセスの制御に使用されます。リストからデータセットを選択するか、データセットを名前で検索します。
テーブルまたはビューに接続する
BigQuery テーブルでは、個々のレコードが行の形式にまとめられています。各レコードは列(フィールドとも呼ばれる)で構成されています。BigQuery ビューは SQL クエリによって定義される仮想テーブルです。Looker Studio のデータソースは、単一のテーブルまたはビュー、あるいはカスタムクエリ(下記を参照)に接続できます。
日付パーティション分割テーブルに接続する
設定列のこのオプションは、日付パーティション分割テーブルを選択すると表示されます。パーティション フィルタを要求した場合、このオプションはデフォルトで選択されていますが、要求していない場合はデフォルトで選択解除されています。テーブルに 1 つ以上の有効な日付フィールドまたは日時フィールドが含まれている場合、データソース内の期間ディメンションとして使用するフィールドを選択できます。詳しくは、BigQuery の日付パーティション分割テーブルに関する説明をご覧ください。
カスタムクエリを使用して接続する
1 つの表に接続する代わりに、SQL クエリを指定するには [カスタムクエリ] オプションを選択します。Looker Studio では、データベースに対するクエリが生成されるたびに、このカスタム SQL が内部 SELECT ステートメントとして使用されます。
カスタム SQL クエリには、1 つのステートメントのみを含めることがます。
たとえば以下は、複数の SQL ステートメントが含まれるため機能しません。
DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;
SELECT total_bytes_billed / (1024 * 1024))* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;
これは、BigQuery で検索する場合も同様です。クエリ結果セットが生成されるのは、ステートメントが 1 つの場合のみです。
独自のカスタムクエリを作成するには、まずアクセス権を持っているプロジェクトを選択します。ここで指定したプロジェクトが請求の際に使用されます。次に、SQL クエリを入力します。
カスタムクエリの構文
カスタムクエリの構文は、標準 SQL 言語に準拠している必要があります。
レガシーの BigQuery SQL 言語を使用する場合は、[レガシー SQL を使用する] をオンにします。
BigQuery ユーザー インターフェースでクエリの動作をテストしたうえで、そのクエリをコピーして Looker Studio に貼り付けます。
クエリ パラメータ
パラメータを使用すると、よりレスポンシブで、カスタマイズ可能なレポートを作成できます。BigQuery データソースのパラメータは、基になるクエリに戻すことができます。カスタムクエリでパラメータを使用するには、BigQuery でのパラメータ化されたクエリの実行に関する構文ガイドラインをご覧ください。
詳しくは、カスタムクエリでパラメータを使用するをご覧ください。
データソースを編集する
データソースによって、データを閲覧できるユーザーやそのデータの更新頻度などを制御できます。また、計算フィールドとパラメータをデータソースに追加することも可能です。レポートに追加したデータソースを編集するには:
- メニューで、[リソース] > [追加済みのデータソースの管理] の順に選択します。
- 一覧から該当するデータソースを見つけて、右側の [編集]
をクリックします。
詳しくは、データソースを編集するをご覧ください。
備考
BigQuery は有料サービスであり、Looker Studio を使用して BigQuery にアクセスすると、BigQuery の利用料金が発生します。レポートの編集中、レポートのキャッシュ保存中、またはレポートの閲覧時に(不定期)、BigQuery に対するクエリが発行されます。
詳しくは、BigQuery の請求先アカウントの設定をご覧ください。
複数日のテーブル
BigQuery は、複数のテーブルにまたがるクエリ実行をサポートしており、各テーブルは 1 日のデータを保持しています。テーブルの形式は YYYYMMDD です。Looker Studio が YYYYMMDD 形式のテーブルを見つけると、複数日のテーブルとしてマークされ、「prefix_YYYYMMDD」という名前のみがそのテーブルに表示されます。
グラフを作成してこのテーブルを視覚化すると、デフォルトの期間である過去 28 日間のデータが自動的に生成され、過去 28 日間のテーブルに対するクエリが適切に実行されます。この設定を行うには、レポートを編集モードに切り替えてグラフを選択し、[データ] タブで [期間] プロパティを調整します。
キャッシュ
Looker Studio は、動作のスピードを上げるために、レポートのデータをキャッシュから取得しようとします。BigQuery のキャッシュは、デフォルトで 12 時間ごとに期限切れになります。キャッシュを更新すると、BigQuery の費用が発生する可能性があります。
キャッシュとレポートの表示
データがキャッシュされ、レポートが表示されると、Looker Studio はキャッシュからデータにアクセスしようとするため、BigQuery の費用は最小限に抑えられます。
キャッシュはベスト エフォート型の機能であり、クエリ レスポンスのサイズによっては利用できない可能性があります。
BigQuery に発行された SQL の表示
Looker Studio によって生成されたすべての BigQuery SQL は、BigQuery のクエリ履歴画面で確認できます。
[レコード数] 指標
BigQuery データソースでは、[レコード数] 指標が自動的に表示されます。この指標を使用することで、ディメンションを分割し、レコード数をグラフごとに集計して表示することができます。
割り当てと上限
BigQuery データソースには、BigQuery 自体と同じレート制限と割り当て制限が適用されます。
VPC Service Controls のサポート
Looker Studio は、閲覧者の IP ベースのアクセス権を使用して、VPC Service Control 境界で保護された BigQuery プロジェクトに接続できます。
BigQuery の GEOGRAPHY ポリゴンを可視化する
レポートで Google マップの可視化を使用して、GEOGRAPHY ポリゴンを表示できます。こちらをクリックしてチュートリアルをご覧ください。
ジョブラベルで Looker Studio のクエリを特定する
Looker Studio から BigQuery に送信されるクエリには、すべて BigQuery のジョブラベル requestor:looker_studio
が付いています。このジョブラベルを使用すると、Looker Studio に関連する BigQuery のクエリを特定できます。手順は、ジョブラベルの表示でご確認ください。