Google BigQuery に接続する

データポータルを BigQuery テーブルに接続します。

Google が全面的に管理している BigQuery は、ペタバイトの規模を誇る低料金の分析データ ウェアハウスです。データポータルの BigQuery コネクタを使用すると、データポータルで BigQuery テーブルのデータにアクセスできます。

BigQuery は有料のサービスです。データポータル経由で BigQuery にアクセスすると、BigQuery の利用料金が発生します。
この記事の内容:

BigQuery に接続する方法

データポータルは、単一の Google BigQuery のテーブルまたはビュー、あるいはカスタムクエリに接続できます。

  1. データポータルにログインします。
  2. 左上にある 作成 をクリックして、[データソース] を選択します。
  3. BigQuery コネクタを選択します。
  4. 接続の詳細を入力します(下記をご覧ください)。
  5. 右上の [接続] をクリックします。
    1. データソースのフィールド パネルが表示されます。
    2. データソースがデータセットに接続されます。

 

課金プロジェクトを選択する

レポートが BigQuery の無料割り当てを超過した場合に課金される BigQuery 課金プロジェクトを選択します。

最近のプロジェクト

このオプションを使用すると、最近 GCP Cloud Console でアクセスしたプロジェクトを見つけることができます。

マイ プロジェクト

このオプションを使用すると、アクセス権があるプロジェクトを選択することができます。プロジェクト ID を手動で入力することもできます。

共有プロジェクト

共有プロジェクトへのアクセスにはこのプロジェクトを使用し、請求処理には別のプロジェクトを使用します。

データセットとテーブルまたはビューを選択する

データセットは、テーブルビューへのアクセスを整理して制御するために使用される最上位のコンテナです。リストからデータセットを選択するか、データセットを名前で検索します。

公開データセット

このオプションを使用すると、BigQuery 一般公開データセットにアクセスできます。BigQuery では、プロジェクトではなく、データセットが共有される公開サンプルを多数用意しています。このデータに対してクエリを実行するには独自の課金プロジェクトを指定する必要があります。ここで選択したプロジェクトが共有データにおける処理費用の請求に使用されます。

日付分割テーブルに接続する

設定列のこのオプションは、日付分割テーブルを選択すると表示されます。デフォルトでは、データソースはテーブルのパーティション時刻を期間ディメンションとして使用します。テーブルに 1 つ以上の有効な日付フィールドや日時フィールドが含まれている場合、データソース内の期間ディメンションとして使用するフィールドを選択できます。詳しくは、BigQuery の日付分割テーブルに関する説明をご覧ください。

カスタムクエリ

[カスタムクエリ] オプションを選択すると、1 つの表に接続する代わりに、SQL クエリが提供されます。データポータルでは、データベースに対するクエリが生成されると、このカスタム SQL を内部 SELECT 文として使用します。

独自のカスタムクエリを作成するには、まずアクセス権を持っているプロジェクトを選択します。ここで指定したプロジェクトが請求の際に使用されます。次に、SQL クエリを入力します。

カスタムクエリの構文

カスタムクエリの構文は、標準 SQL 言語に準拠している必要があります。

レガシーの BigQuery SQL 言語を使用する場合は、[レガシー SQL の使用] をオンにします。

BigQuery ユーザー インターフェースでクエリの動作をテストしたうえで、そのクエリをコピーしてデータポータルに貼り付けます。

クエリ パラメータ

パラメータを使用すると、よりレスポンシブで、カスタマイズ可能なレポートを作成できます。BigQuery データソースのパラメータは、基になるクエリに戻すことができます。カスタムクエリでパラメータを使用するには、BigQuery でパラメータ化されたクエリを実行するために記述された構文ガイドラインをご覧ください。

詳しくは、カスタムクエリでパラメータを使用するをご覧ください。

詳細設定

[課金プロジェクト ID をオーバーライドする] オプションを使用して、カスタムクエリに別の課金プロジェクト ID を指定します。

Google データの統合

一部の Google サービスでは、データが BigQuery テーブルに直接書き出されます。認識されると、一般的な集計、計算、フィールド名がフィールドに自動的に追加されます。

Google アナリティクスの BigQuery Export

データポータルでは、Google アナリティクスの BigQuery Export で生成されたテーブルの横には Google アナリティクスのアイコンが表示されます。選択すると、Google アナリティクスで見られる一般的な指標の多くが、データポータルのフィールドとして自動的に作成されます。

BigQuery BI Engine

BigQuery BI Engine は、高速なメモリ内分析サービスです。BI Engine を使用すると、BigQuery に保存されたデータを分析できます。クエリ応答時間は 1 秒未満で、同時実行性にも優れています。データポータルを BI Engine で管理されている BigQuery テーブルに接続することで、レポートと原因分析を高速化できます。

BI Engine は、データポータルのユーザーに最大 1 GB の空き容量を提供します。

詳しくは、BI Engine をデータポータルで使ってみるをご覧ください。

留意事項

BigQuery は有料のサービスです。データポータル経由で BigQuery にアクセスすると、BigQuery の利用料金が発生します。レポートの編集中、レポートのキャッシュ保存中、またはレポートの閲覧時に(不定期)、BigQuery に対するクエリが発行されます。

詳しくは、BigQuery の請求先アカウントの設定をご覧ください。

複数日のテーブル

BigQuery は、複数のテーブルにまたがるクエリ実行をサポートしており、各テーブルは 1 日のデータを保持しています。テーブルの形式は YYYYMMDD です。テーブルの形式は YYYYMMDD です。データポータルが YYYYMMDD 形式のテーブルを見つけると、複数日のテーブルとしてマークされ、「prefix_YYYYMMDD」という名前のみがそのテーブルに表示されます。

グラフを作成してこのテーブルを視覚化すると、デフォルトの期間である過去 28 日間のデータが自動的に生成され、過去 28 日間に対するクエリが適切に実行されます。この設定を行うには、レポートを編集モードに切り替えてグラフを選択し、[データ] タブで [期間] プロパティを調整します。

キャッシュ

データポータルは、動作のスピードを上げるために、キャッシュからデータを取得しようとします。BigQuery のキャッシュは、デフォルトで 12 時間ごとに期限切れになります。キャッシュを更新すると、BigQuery の費用が発生する可能性があります。

キャッシュとレポートの表示

データがキャッシュされ、レポートが表示されると、データポータルはキャッシュからデータにアクセスしようとするため、BigQuery の費用は最小限に抑えられます。

キャッシュはベスト エフォート型の機能であり、クエリ レスポンスのサイズによっては利用できない可能性があります。

詳しくはキャッシュの詳細をご覧ください。

BigQuery に発行された SQL の表示

データポータルによって生成されたすべての BigQuery SQL は、BigQuery のクエリ履歴画面で確認できます。

[レコード数] 指標

BigQuery データソースでは、[レコード数] 指標が自動的に表示されます。この指標を使用することで、ディメンションを分割し、レコード数をグラフごとに集計して表示することができます。

割り当てと上限

BigQuery データソースには、BigQuery 自体と同じレート制限と割り当て制限が適用されます。

VPC Service Controls のサポート

データポータルは、閲覧者の IP ベースのアクセス権を使用して、VPC Service Control 境界で保護された BigQuery プロジェクトに接続できます。

BigQuery の GEOGRAPHY ポリゴンの可視化

レポートで Google マップの可視化を使用して、GEOGRAPHY ポリゴンを表示できます。こちらをクリックしてチュートリアルをご覧ください

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
102097
false