Google BigQuery に接続する

データポータルを BigQuery テーブルに接続します。

Google が全面的に管理している BigQuery は、ペタバイトの規模を誇る低料金の分析データ ウェアハウスです。データポータルの BigQuery コネクタを使用すると、データポータルで BigQuery テーブルのデータにアクセスできます。

BigQuery は有料のサービスです。データポータル経由で BigQuery にアクセスすると、BigQuery の利用料金が発生します。詳しくは、BigQuery の料金をご覧ください。
この記事の内容:

BigQuery に接続する方法

データポータルは、単一の Google BigQuery のテーブルまたはビュー、あるいはカスタムクエリに接続できます。以下の手順でコネクタを選択するように求められたら、[BigQuery] コネクタを選択します。

接続を行うための手順

データに接続するには、新しい埋め込みデータソースを作成するか、既存の(再利用可能な)データソースを選択します。

埋め込みデータソースと再利用可能なデータソースの比較

データソースは、埋め込みデータソースか再利用可能なデータソースのいずれかになります。レポートには、埋め込みデータソースと再利用可能なデータソースの両方を使用できます。

レポートの編集中に作成したデータソースは、レポート内に埋め込まれます。埋め込みデータソースを編集するには、そのレポート内で編集する必要があります。埋め込みデータソースを使用すると、レポートとデータソースの共同編集がよりスムーズに行えるようになります。レポートを編集できるユーザーであれば、データソースの編集と接続の変更も行えます。

ホームページから作成するデータソースは再利用できます。これらのデータソースはさまざまなレポートで再利用でき、再利用可能なデータソースを使用すれば、組織全体で一貫したデータモデルを作成および共有できます。再利用可能なデータソースを編集できるのは共有相手のみで、接続を変更できるのはデータソースの認証情報のオーナーのみです。

詳しくは、データソースをご覧ください。

  1. データポータルにログインします。
  2. 左上にある 作成 [作成] をクリックして、[レポート] を選択します。
  3. レポート エディタが表示され、[データのレポートへの追加] パネルが開きます。
  4. 新しい埋め込みデータソースを作成するには、コネクタを選択します。
    1. 再利用可能な既存のデータソースを選択するには、[マイ データソース] タブをクリックし、以前に作成したデータソースや、共有されているデータソースを選択します。必要に応じて、そのデータソースのデータソースへの接続を編集できます。
  5. データセットへの接続を構成します。以降のセクションでは、接続のオプションについて詳しく説明します。
  6. 右下の [追加] をクリックします。

しばらくすると、データソースのフィールドを含むテーブルがレポートのキャンバスに表示されます。キャンバスの右側にあるプロパティ パネルから、テーブルのデータやスタイルを変更できます。キャンバスの上部にあるツールバーを使って、レポートにグラフやコントロールなどのコンポーネントを追加することも可能です。

データポータルを初めてご利用の場合

レポート作成のチュートリアル、またはレポート エディタに関する記事をご覧ください。

データソースの接続を構成する

プロジェクトを選択する

プロジェクトでは、BigQuery リソースを整理し、レポートが BigQuery の無料割り当てを超過した場合に課金を行います。課金とデータ管理の両方に同じプロジェクトを使用したり、1 つのプロジェクトをデータ用に使用し、別のプロジェクトで課金を行ったりすることもできます。詳しくは、Google Cloud プロジェクトをご覧ください。

次のいずれかのオプションを選択して、プロジェクトを選択します。

最近のプロジェクト

このオプションを使用すると、最近 Google Cloud コンソールでアクセスしたプロジェクトを見つけることができます。プロジェクト ID を手動で入力することもできます。選択したプロジェクトは、課金とデータアクセスの両方に使用されます。プロジェクトを選択したら、データセットを選択します。

マイ プロジェクト

このオプションを使用すると、アクセス権があるプロジェクトを選択することができます。プロジェクト ID を手動で入力することもできます。選択したプロジェクトは、課金とデータアクセスの両方に使用されます。プロジェクトを選択したら、データセットを選択します。

多くのプロジェクトへのアクセス権を持っている場合は、一部のプロジェクトが一覧に表示されない可能性があります。一覧のアイテム数が上限を超えている場合は、一覧に表示されていないプロジェクトを入力フィールドに直接入力できます。

共有プロジェクト

共有プロジェクトにアクセスするには、このオプションを使用します。必要に応じて、データと課金に異なるプロジェクトを選択できます。プロジェクトを選択したら、データセットを選択します。

カスタムクエリ

カスタムクエリの課金プロジェクトを指定するには、このオプションを使用します。データへのアクセスには、同じプロジェクトを使用することも、別のプロジェクトを使用することもできます。課金プロジェクトを選択したら、クエリを作成します。このクエリでは、以下のスクリーンショットに示すように、FROM 句でデータ用に別のプロジェクトを指定できます。

課金プロジェクトが「データポータル プロジェクト」に設定された BigQuery カスタムクエリ構成の例。クエリでは、クエリの FROM 句で BigQuery の一般公開データセットが指定されます。

一般公開データセット

BigQuery の一般公開データセットにアクセスするには、このオプションを使用します。BigQuery では、プロジェクトではなく、データセットが共有される公開サンプルを多数用意しています。このデータに対してクエリを実行するには独自の課金プロジェクトを指定する必要があります。ここで選択したプロジェクトが共有データにおける処理費用の請求に使用されます。

データセットを選択する

データセットは、データの整理とデータアクセスの制御に使用されます。リストからデータセットを選択するか、データセットを名前で検索します。

テーブルまたはビューに接続する

BigQuery テーブルでは、個々のレコードが行の形式にまとめられています。各レコードは列(フィールドとも呼ばれる)で構成されています。BigQuery ビューは SQL クエリによって定義される仮想テーブルです。データポータルのデータソースは、単一のテーブルまたはビュー、あるいはカスタムクエリに接続できます(下記をご覧ください)。

日付分割テーブルに接続する

設定列のこのオプションは、日付分割テーブルを選択すると表示されます。デフォルトでは、データソースはテーブルのパーティション時刻を期間ディメンションとして使用します。テーブルに 1 つ以上の有効な日付フィールドや日時フィールドが含まれている場合、データソース内の期間ディメンションとして使用するフィールドを選択できます。詳しくは、BigQuery の日付分割テーブルに関する説明をご覧ください。

カスタムクエリを使用して接続する

[カスタムクエリ] オプションを選択すると、1 つの表に接続する代わりに、SQL クエリが提供されます。データポータルでは、データベースに対するクエリが生成されると、このカスタム SQL を内部 SELECT ステートメントとして使用します。

独自のカスタムクエリを作成するには、まずアクセス権を持っているプロジェクトを選択します。ここで指定したプロジェクトが請求の際に使用されます。次に、SQL クエリを入力します。

カスタムクエリの構文

カスタムクエリの構文は、標準 SQL 言語に準拠している必要があります。

レガシーの BigQuery SQL 言語を使用する場合は、[レガシー SQL の使用] をオンにします。

BigQuery ユーザー インターフェースでクエリの動作をテストしたうえで、そのクエリをコピーしてデータポータルに貼り付けます。

クエリ パラメータ

パラメータを使用すると、よりレスポンシブで、カスタマイズ可能なレポートを作成できます。BigQuery データソースのパラメータは、基になるクエリに戻すことができます。カスタムクエリでパラメータを使用するには、BigQuery でパラメータ化されたクエリを実行するために記述された構文ガイドラインをご覧ください。

詳しくは、カスタムクエリでパラメータを使用するをご覧ください。

データソースを編集する

データソースによって、データを閲覧できるユーザーやそのデータの更新頻度などを制御できます。また、計算フィールドとパラメータをデータソースに追加することも可能です。レポートに追加したデータソースを編集するには:

  1. メニューで、[リソース] > [追加済みのデータソースの管理] の順に選択します。
  2. 一覧から該当するデータソースを見つけて、右側の [編集] 編集 をクリックします。

詳しくは、データソースの編集をご覧ください。

備考

BigQuery は有料のサービスです。データポータル経由で BigQuery にアクセスすると、BigQuery の利用料金が発生します。レポートの編集中、レポートのキャッシュ保存中、またはレポートの閲覧時に(不定期)、BigQuery に対するクエリが発行されます。

詳しくは、BigQuery の請求先アカウントの設定をご覧ください。

複数日のテーブル

BigQuery は、複数のテーブルにまたがるクエリ実行をサポートしており、各テーブルは 1 日のデータを保持しています。テーブルの形式は YYYYMMDD です。テーブルの形式は YYYYMMDD です。データポータルが YYYYMMDD 形式のテーブルを見つけると、複数日のテーブルとしてマークされ、「prefix_YYYYMMDD」という名前のみがそのテーブルに表示されます。

グラフを作成してこのテーブルを視覚化すると、デフォルトの期間である過去 28 日間のデータが自動的に生成され、過去 28 日間に対するクエリが適切に実行されます。この設定を行うには、レポートを編集モードに切り替えてグラフを選択し、[データ] タブで [期間] プロパティを調整します。

キャッシュ

データポータルは、動作のスピードを上げるために、キャッシュからデータを取得しようとします。BigQuery のキャッシュは、デフォルトで 12 時間ごとに期限切れになります。キャッシュを更新すると、BigQuery の費用が発生する可能性があります。

キャッシュとレポートの表示

データがキャッシュされ、レポートが表示されると、データポータルはキャッシュからデータにアクセスしようとするため、BigQuery の費用は最小限に抑えられます。

キャッシュはベスト エフォート型の機能であり、クエリ レスポンスのサイズによっては利用できない可能性があります。

詳しくはキャッシュの詳細をご覧ください。

BigQuery に発行された SQL の表示

データポータルによって生成されたすべての BigQuery SQL は、BigQuery のクエリ履歴画面で確認できます。

[レコード数] 指標

BigQuery データソースでは、[レコード数] 指標が自動的に表示されます。この指標を使用することで、ディメンションを分割し、レコード数をグラフごとに集計して表示することができます。

割り当てと上限

BigQuery データソースには、BigQuery 自体と同じレート制限と割り当て制限が適用されます。

VPC Service Controls のサポート

データポータルは、閲覧者の IP ベースのアクセス権を使用して、VPC Service Control 境界で保護された BigQuery プロジェクトに接続できます。

BigQuery の GEOGRAPHY ポリゴンの可視化

レポートで Google マップの可視化を使用して、GEOGRAPHY ポリゴンを表示できます。こちらをクリックしてチュートリアルをご覧ください

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
102097
false
false