コンテンツ データのインポート例

サイト運営システムから著者情報を読み込む方法を学びます。

著者、公開されたデータ、記事カテゴリなど、コンテンツのメタデータを読み込むと、コンテンツをそのディメンションに応じてグループ分けできます。

この記事の内容:

シナリオ

サイトを運営しており、サイトで最も人気のある著者が誰なのかを確認するとします。人気度を測定するためには、各著者の記事のページビュー数を集計したレポートが必要です。

ステップ 1: インポートするデータを決定する

Google アナリティクス外で管理している各記事とその著者が関連付けられたデータファイルを Google アナリティクスにアップロードします。

ステップ 2: カスタム ディメンションを作成する

Google アナリティクスでは、「著者」がディメンションとして用意されていないため、カスタム ディメンションとして作成する必要があります。

カスタム ディメンション名 インデックス スコープ
著者 1 ヒット

ステップ 3: データセットを作成する

  1. [管理] から、データをアップロードするアカウントとウェブ プロパティに移動します。
  2. [プロパティ] セクションにある [データのインポート] をクリックします。
  3. [+ 新しいデータセット] をクリックします。
  4. タイプとして [コンテンツ データ] を選択します。
  5. データセットの名前を「著者と記事」にします。
  6. データを表示するビューを 1 つ以上選択します。
  7. 以下の例をモデルとして使用してスキーマを定義します。

スキーマの例

ヒットデータの記事 ID は明示的に送信しませんが、ページ URL に記事 ID を含めます。これらの記事を掲載するページのページ URL の形式に矛盾がない場合、正規表現を使用して URL の article_id 部分で一致させることができます。記事ページの URL が「http://www.example.com/articles/abc123.html」(「abc123」は「article_id」)の形式と一致しているとします。URL の article_id で結合するには、「ページ」をキーに選択し、[正規表現による絞り込み] を選択して、テキスト フィールドに正規表現を「/articles/([^/]+).html$」と入力します。

スキーマの設定:

キー: ページ
正規表現で絞り込む: /articles/([^/]+).html$
インポートされたデータ: 著者
ヒットデータの上書き: はい

URL パラメータを抽出する

特別な処理が必要となるのは、URL「http://www.example.com/articles/abc123.php?param=value」の「param=value」のような URL クエリ パラメータを抽出する場合です。

たとえば、パラメータの値「param」だけ一致させたい場合、[キー] で [ページ] を選択して、[クエリによる絞り込み] オプションを選んでから、テキスト ボックスに「param」と入力します。ページ URL に含まれる UTM ID を「?utm_id=abc123」として抽出したい場合、[クエリによる絞り込み] オプションを選択し、テキスト ボックスに「utm_id」と入力します。

ステップ 4: CSV ファイルを作成する

アップロード用 CSV ファイルを作成するには、以下の 2 つの作業を行います。

1. CSV のヘッダーを取得する

データセットの表で、「著者と記事」の [アップロードを管理] をクリックします。アップロードの管理表で、[操作を選択] > [CSV ヘッダーを表示] の順にクリックします。次のような文字列が表示されます。

CSV header
ga:pagePath,ga:dimension1

 

このヘッダーは、アップロードする CSV ファイルの 1 行目として使用してください。以下の表は列を示します。

ページ 著者
ga:pagePath ga:dimension1

2. スプレッドシートを作成し、CSV 形式でエクスポートする

上記の形式の Google スプレッドシートを作成します。スプレッドシートの最初の(ヘッダー)行は、上記の [CSV ヘッダーを表示] ダイアログ ボックスで示している内部名(ページではなく ga:pagePath など)を使用する必要があります。各ヘッダーのセルの下の列に、各ヘッダーに対応するデータを含めるようにします。

ga:pagePath ga:dimension1
how_to_make_pizza John Dough
how_to_make_doughnuts Benny Cruller
how_to_build_a_treehouse Oona Limb
how_to_make_paper_airplanes Hellen Wings

 

スプレッドシートを CSV 形式でエクスポートすると、ファイルは次のようになります。

ga:pagePath,ga:dimension1
how_to_make_pizza,John Dough
how_to_make_doughnuts,Benny Cruller
how_to_build_a_treehouse,Oona Limb
how_to_make_paper_airplanes,Hellen Wings

ステップ 5: データをアップロードする

これで、作成した CSV ファイルを Google アナリティクスへアップロードできます。その際、Google アナリティクスの管理画面から手動でアップロードする方法と Management API を使用してプログラムでアップロードする方法のいずれかを選ぶことができます。

手動でアップロードする
  1. データセットの表で、「著者と記事」の行を探します。

  2. [色とサイズ] データセットで [アップロードの管理] をクリックします。
  3. [ファイルをアップロード] をクリックしてファイルを選択し、[アップロード] をクリックします。
Management API を使用してアップロードする
  1. データセットの表で、「著者と記事」の行を探します。
  2. データセット名をクリックします。
  3. [カスタムデータ ソース ID を取得…] をクリックします。
  4. ID をコピーします。
  5. こちらの手順に従って、Management API 経由でアップロードします。

ステップ 6: レポートにデータを表示する

著者はカスタム ディメンションであるため、標準のレポートには表示されません。著者ごとの総ページビュー数を確認する場合は、1 つの指標(ページビュー数)と 1 つのディメンション(著者)を追加したカスタム レポートを作成します。

アップロードされたデータは、処理が完了するまでレポートには表示されません。処理が完了してからインポートしたデータが外部からのヒットデータに統合されるようになるまでには、24 時間程度かかることがあります。

この記事は役に立ちましたか?
改善できる点がありましたらお聞かせください。