この記事では、2023 年 7 月 1 日(アナリティクス 360 プロパティの場合は 2023 年 10 月 1 日)をもってデータ処理が停止されるユニバーサル アナリティクス プロパティについて説明します。まだ使用していない場合は、Google アナリティクス 4 プロパティの使用を開始してください。

正規表現(regex)について

Google アナリティクスは正規表現に対応しているため、ビューフィルタ目標セグメントユーザーリストコンテンツ グループチャネル グループなどの機能で柔軟な指定が可能です。

この記事では、ユニバーサル アナリティクスと Google アナリティクス 4 の両方での正規表現について説明します。

Google アナリティクスでは、特定の文字列が正規表現として使用され、対象範囲を自在に調整しながら Google アナリティクス データに含まれるパターンに一致させることができます。

たとえば、自社の従業員によるアクセスで発生したサイトデータを除外するビューフィルタを作成するには、従業員が使用する IP アドレスの全範囲を発生元とするすべてのデータを除外する正規表現を使用します。このとき、IP アドレスの範囲が 198.51.100.1~198.51.100.25 の場合、25 個の IP アドレスを入力するのではなく、このアドレス全体に一致する 198\.51\.100\.\d* のような正規表現を作成します。

また、2 つの異なる都市のキャンペーン データのみを対象とするビューフィルタを作成するには、大阪|東京(大阪または東京)のような正規表現を作成します。

正規表現のメタ文字

ワイルドカード

. 任意の 1 文字(文字、数字、記号)に一致します 「1.」で一致するデータ:
10、1A

「1.1」で一致するデータ:
111、1A1

? 直前の文字が 0 回または 1 回出現する場合に一致します 「10?」で一致するデータ:
1、10

+ 直前の文字が 1 回以上出現する場合に一致します 「10+」で一致するデータ:
10、100

* 直前の文字が 0 回以上出現する場合に一致します 「1*」で一致するデータ:
1、10

| OR 条件を作成します

正規表現の末尾では使用しないでください
「1|10」で一致するデータ:
1、10

アンカー

^ 隣接する文字が文字列の先頭である場合に一致します 「^10」で一致するデータ:
10100、10x

「^10」で一致しないデータ:
110、110x

$ 隣接する文字が文字列の末尾である場合に一致します 「10$」で一致するデータ:
110、1010

「10$」で一致しないデータ:
100、10x

グループ

( ) 囲まれた文字が同じ順序で文字列に含まれる場合に一致します


他の正規表現をグループ化する場合にも使用します
「(10)」で一致するデータ:
10101、1011

「([0-9]|[a-z])」で一致するデータ:
すべての数字と小文字

[ ] 囲まれた文字が任意の順序で文字列に含まれる場合に一致します 「[10]」で一致するデータ:
012、120、210

- 角かっこ内の文字範囲が文字列に含まれる場合に一致します 「[0-9]」で一致するデータ: 0~9 のすべての数字

エスケープ文字

\ 隣接する文字を正規表現のメタ文字としてではなく通常の文字として解釈するよう指定します 「\.」と指定すると、隣接するドットがワイルドカードとしてではなく、ピリオドや小数点として解釈されます。

「216\.239\.32\.34」で一致するデータ:
216.239.32.34

 

ヒント

ユニバーサル アナリティクスと Google アナリティクス 4 でのデフォルトの動作の比較

デフォルトでは、ユニバーサル アナリティクス プロパティの正規表現は「部分一致」として扱われます。指定したパターンがデータのどこかに含まれている場合は、式が true になります。

たとえば、「India」というパターンを指定すると、正規表現は「India」、「Indian」、「Indiana」、「Indianapolis」などと一致します。この部分一致の場合、メタ文字を使用する必要はありません。

Google アナリティクス 4 プロパティでは、デフォルトの正規表現は「完全一致」です。データは、指定されたパターンと完全に一致している必要があります。たとえば、パターン「India」は「India」にのみ一致します。この正規表現を部分一致として扱うには、メタ文字を使用する必要があります。たとえば「India.*」と指定すると、「India」で始まり、任意の文字列(または何もない)で終わる値が返されます。

式はシンプルに

正規表現はシンプルに作成してください。正規表現がシンプルであれば、他のユーザーが簡単に解釈して変更できます。

メタ文字の一致

バックスラッシュ「\」を使用すると、正規表現のエスケープ文字が通常の文字として解釈されます。たとえば、ドットを IP アドレスの小数点区切りとして使用する際は、ワイルドカードとして解釈されないように、バックスラッシュ(\.)を付けて使用します。

メタ文字を使用して一致を制限する

正規表現は最長一致の特徴があるため、明示的に除外しない限り、指定した内容だけでなく隣接する文字も一致します。たとえば、部分一致の場合、site、mysite、yoursite、parasite(「site」を含む文字列)に一致します。具体的な一致が必要な場合は、それに合わせて正規表現を作成します。たとえば、文字列「site」のみに一致させるには、「site」が文字列の先頭かつ末尾であることを示す正規表現「^site$」を作成します。

Google RE2 正規表現の構文

この情報は役に立ちましたか?
改善できる点がありましたらお聞かせください。

さらにサポートが必要な場合

問題を迅速に解決できるよう、ログインして追加のサポート オプションをご利用ください。

検索
検索をクリア
検索を終了
Google アプリ
メインメニュー
ヘルプセンターを検索
true
69256
false
false