データポータルのパフォーマンスを上げる

レポートの読み込み時間を短縮し、グラフの応答性を高めるためのヒントを紹介します。

データポータル レポートでは、フィルタの適用や期間の変更など閲覧者が加えた変更を読み込み、応答するのにかかる時間が、次のようなさまざまな要因によって変わります。

  • 基になるデータセットのパフォーマンス
  • レポートのビジュアリゼーションによってクエリが実行されているデータの量
  • 上記クエリの複雑さ
  • ネットワーク遅延

こうした要因の中には、ユーザー自身(またはデータポータル)では制御できないものもあります。たとえば、基盤となるデータ プラットフォームの応答性を向上させたり、ネットワーク接続の速度を上げたりするためにユーザーができることはほとんどありません。ただし、データポータルでレポートのパフォーマンスを調整する方法はいくつかあります。

パフォーマンスの調整には、速度と応答性のトレードオフが関係する場合もあれば、最新のデータとユーザーによるカスタマイズのトレードオフが関係する場合もあります。ここで紹介するヒントは、すべてのお客様のユースケースに適しているものではありません。

データの更新頻度を調整する

データポータルでは、パフォーマンス調整機能の一部をすでに内部で利用しています(Google では、これらの機能の改善に継続的に取り組んでいます)。たとえば、データポータルの場合、レポートのパフォーマンスを向上させるためにキャッシュと呼ばれる一時的なストレージ システムからデータを取得します。キャッシュ データを取得するほうが、基になるデータセットから直接取得するよりも処理時間がかなり短くなる場合があります。また、キャッシュ データを取得すると、データセットから直接提供する必要のあるクエリの数が減るため、BigQuery などの有料サービスの費用を最小限に抑えることができます。

キャッシュ内のデータが更新される頻度をデータの更新頻度と呼びます。実際の更新頻度はコネクタによって異なりますが、可能であれば、更新間隔を長めに設定することをおすすめします。次の更新までの間に繰り返し実行されるクエリの回答にはキャッシュが使用されるため、間隔が長いほうがレポートのパフォーマンスが向上します。ただし、トレードオフとして、最新情報を取得できない可能性があります。

詳しくは、データの更新頻度を管理するをご覧ください。

抽出されたデータソースを使用する

デフォルトでは、データソースと基になるデータセットのライブ接続は維持されています。上記のキャッシュが期限切れになった場合や、キャッシュでは対応できない新しいクエリが実行された場合、データポータルはデータセットにアクセスして対象データを取得します。このような時間のかかるデータ取得を回避するには、既存のデータソースから最大 100 MB のデータを、抽出済みデータソースとして抽出します。

必要な特定のフィールドを選択してフィルタを適用し、期間を追加してデータのスナップショットを作成します。スナップショットを作成すると、元のデータにライブ接続した状態よりも、レポートや原因分析の読み込みが速くなり、応答性が高くなることがあります。この場合のトレードオフとして、抽出されたデータソースは静的な状態になります。つまり、データソース自体が更新されるまでレポートのデータは変わりません。ただし、抽出されたデータソースを自動的に更新するようスケジュールを設定できるため、それほど問題とならない可能性があります。

詳しくは、データの抽出に関する記事をご覧ください。

BI Engine を使用して BigQuery データソースを高速化する

BigQuery BI Engine は、高速なメモリ内分析サービスです。BI Engine を使用すると、BigQuery に保存されたデータを分析できます。クエリ応答時間は 1 秒未満で、同時実行性にも優れています。

BI Engine はデータポータルと統合されるため、データ探索や分析がスピードアップします。BI Engine を使用すると、パフォーマンス、スケーリング、セキュリティ、データの鮮度を損なうことなく、データポータルで高機能かつインタラクティブなダッシュボードとレポートを作成できます。

詳しくは、BI Engine をデータポータルで使ってみるをご覧ください。

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。
検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
102097
false