Google Cloud Storage に接続する

世界中のどこからでもデータを無制限に保存、取得できる Google Cloud Storage(GCS)は、Google のクラウドのパフォーマンスと拡張性に加え、高度なセキュリティと共有機能も兼ね備えています。Google Cloud Storage コネクタを使うと、GCS のデータに基づいてレポートとダッシュボードを作成、共有できるようになります。

この記事の内容:

Google Cloud SQL に接続する方法

GCS のデータソースは、単一のテキスト ファイル(CSV 形式)または Google Cloud Storage バケットに保存されているフォルダに接続できます。フォルダに接続すると、データポータルは、データソースにデータを入力するため、検出したすべての CSV ファイルに接続しようとします。

フォルダに接続する場合は、そのフォルダ内のテキスト ファイルがすべて同じ構造(スキーマ)を使用していることを確認してください。構造が異なるファイルにデータソースを接続しようとすると、エラーが発生します。

接続するには

  1. データポータルにログインします。 ログインすると、[レポート] ツールが選択された状態で [ホーム] ページが表示されます。
  2. 左側で [データソース] をクリックしてデータソースのページに移動します。
  3. 右下の 新しいレポートまたはデータソースを作成 をクリックします。
  4. リストから、[Google Cloud Storage コネクタ] を選択します。
    Example of creating a GCS data source.
  5. 承認を求めるメッセージが表示された場合は、[承認] をクリックします。
  6. データへのパスを入力します。
    1. バケット名と親フォルダを入力します。
    2. 1 つのファイルを選択するには、ファイル名を入力します。
    3. 複数のファイルを選択するには、最終フォルダ名を入力し、[パスのすべてのファイルを使用] を選択します。
  7. 右上の [接続] をクリックします。
    1. データソースのフィールド パネルが表示されます。
    2. データソースがデータセットに接続されました。

データソースを設定する

データソースのフィールド パネルで、フィールド名の変更や説明の追加、計算フィールドの追加、データの型と集約の変更など、データソースの設定を行うことができます。詳しくは、データソース フィールドの使い方に関する説明をご覧ください。

データを表示できるユーザーを管理する

フィールド パネルの右上では、データソースの認証情報を変更できます。認証情報を使って、このデータソースによって提供されるデータを表示できるユーザーを管理します。

オーナーの認証情報」を使用すると、データセットへのアクセス権のないユーザーでも、このデータセットを使用するレポートを表示したり作成したりすることができます。

閲覧者の認証情報」を使用すると、データソースの各ユーザーは、データセットにアクセスするために認証情報を提供する必要があります。

詳しくは、データソースの認証情報についての詳細をご覧ください。

データソースから新しいレポートを作成する

  1. 右上の [レポートを作成] をクリックします。
    1. レポート エディタが開きます。
  2. [レポートに追加] をクリックします。
    1. データソースがレポートに追加されます。
    2. グラフの作成と、データをデータソースから取得するためのデータ管理オプションの設定ができるようになります。

データポータルを初めてご利用の場合:

レポート作成のチュートリアル、またはレポート エディタに関する記事をご覧ください。

データを更新する

ファイルに新しいデータを追加する、またはフォルダに新しいファイルを追加すると、そのデータは自動的にデータソースで使用できるようになります。このため、レポートは常に最新の状態に保たれます(通常のキャッシュ ルールが適用されます)。

ファイル形式

接続するファイルでは、正しい形式を使用する必要があります。ファイル形式が正しくない場合は、エラーが発生することや、レポートにデータが正しく表示されないことがあります。

コンテンツ エラーが発生する最もよくある原因として、データ内で区切り文字、引用符、改行文字が誤って使用されていることが考えられます。データポータルでこれらの文字がどのように処理されるか理解しておくと、余分な手間を省くことができます。

表形式のデータのみ

GCS コネクタで処理できるのは、CSV 形式の表形式データファイルのみです。このためファイルは、適切に区切られた行と列からなる標準の構造になっていなければなりません。表内の特定のセルでデータが欠落している場合でも、各行には同じ数の列が設定されている必要があります。結合されたセルを含むファイルや、異なる構造を持つファイルを接続しようとすると、エラーが発生します。

データソースに接続するファイルはすべて同一の構造で、フィールドの順序も同一である必要があります。

既存のデータソースにフィールドを追加または削除する場合は、以前にアップロードしたファイルをすべて削除してから、新しい構造を持つファイルを接続する必要があります(または、新しいファイル構造を使用したデータソースを新しく作成します)。

区切り文字

データに含まれるすべてのフィールドは、それぞれカンマで区切る必要があります。

フィールドの実際のデータにカンマが含まれている場合は、そのフィールドを引用符で囲む必要があります。データに二重引用符が含まれている場合は、単一引用符でフィールドを囲みます。

見出し行

ファイルの 1 行目は、見出し行にする必要があります。この行では、データポータルで使用するフィールドの名前を指定します。フィールド名は重複しないようにする必要があるため、見出し行で重複する値を指定することはできません。

列の名前は以下の要領で指定します。

  • アルファベット、数字、アンダースコアのみを使用する。他の句読点や特殊文字は使用できません。
  • 文字またはアンダースコアを先頭に使用する
  • 半角 128 文字以下で指定する

見出し行は、上記の区切り文字に関する規則に沿ったものにする必要もあります。

改行

ファイル内の行は、それぞれ末尾で改行する必要があります。改行が引用符でエスケープされていても、GCS コネクタではサポートされません。

GCS コネクタの制約

Google Cloud Storage コネクタには次の制約があります。

  • 容量はユーザー 1 人あたり合計 2 GB まで
  • ファイルサイズはデータソースあたり 100 MB まで

Google Cloud Storage

データソースについて

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。