検索
検索をクリア
検索終了
Google アプリ
メインメニュー

正規表現について

更新者: LunaMetrics 、最終更新日: 2008 年 3 月 8 日

Google アナリティクスは正規表現に対応しているので、詳細なトラッキング設定を行うことができます。正規表現とはフィールドの一部分を照合、取得する特殊文字で、すべての文字を制御するルールです。Google アナリティクスのフィルタは多くの場合、正規表現を使用してデータの照合と処理を行っています。

たとえば「IP アドレスからのトラフィックをすべて除外」フィルタは、指定した正規表現に一致した IP アドレスからのアクセスをレポートから除外します。たとえば、「IP アドレスからのトラフィックをすべて除外」フィールドの正規表現を次のように設定したとします。

163\.212\.171\.123

この場合、IP アドレスが 163.212.171.123 のユーザーがサイトにアクセスすると、正規表現で指定した 163\.212\.171\.123 と 163.212.171.123 に一致するため、このユーザーのアクセスは除外されます。上記の正規表現に含まれるバックスラッシュは、正規表現で使用する唯一の特殊文字です。

正規表現で使用される文字

各文字の説明をクリックすると詳細な使用方法を確認できます。

ワイルドカード

. 任意の 1 文字(文字、数字、記号)を表します goo.gle gooogle goodgle goo8gle とマッチします
* 直前のアイテムの 0 回以上の繰り返しを表します デフォルトの直前のアイテムは直前の文字です。 goo*gle gooogle goooogle とマッチします
+ 直前のアイテムの 1 回以上の繰り返しを表します gooo+gle goooogle とマッチし、 google とはマッチしません
? 直前のアイテムの 0 回または 1 回の繰り返しを表します labou? r labor labour の両方とマッチします
| 複数のアイテムのいずれかを表します a|b a または b のいずれかとマッチします

アンカー

^ フィールドの先頭にある文字を対象とします ^site site とマッチし、 mysite とはマッチしません
$ フィールドの最後にある文字を対象とします site$ site とマッチし、 sitescan とはマッチしません
注: アンカー文字につきましては、このページの下部にある 正規表現の使用に関するヒント をご覧ください。

グループ化

() デフォルトを承認するのではなく、 アイテムを指定する場合にかっこを使用します Thank(s|you) Thanks Thankyou の両方とマッチします
[] 角かっこを使用して一致するアイテムのリストを指定します [abc] a b c を含むリストを指定します
- ダッシュを角かっこと一緒に使用してリストの範囲を拡張します [A-Z] は大文字の英語のアルファベットのリストを指定します

その他

\ 正規表現の文字を通常の文字に変換します mysite\.com では、ドット (.) はワイルドカードとして処理されません。

正規表現の使用に関するヒント

  1. 誰でも簡単に扱うことができるよう、できるだけシンプルな表現を使用します。
  2. 「?」や「.」などの正規表現として意味を持つ文字を一致させる場合はにバックスラッシュを使用します。バックスラッシュを使用しない場合、これらは正規表現と解釈されます。
  3. すべての正規表現に特殊文字を含める必要はありません。たとえば Google アナリティクスの目標を正規表現のみで指定することができます。特殊文字を使用しなくても、目標はアナリティクスで正規表現のルールに従って解釈されます。
  4. 正規表現は最長マッチを行います。たとえば site は、 mysite yoursite sitescan とマッチします site が正規表現の場合は、 site を含むすべての文字列を対象に照合が行われるため正確に一致させるには必要に応じてアンカー文字を使用する必要があります。先頭に ^ 、末尾に $ のアンカー文字を指定した ^site$ は、 site で始まって site で終わり、他の文字を含まない文字列のみが検索の対象になります。正規表現 site には特殊文字が含まれていませんが、正規表現を認識するフィールドで指定された場合には正規表現として解釈されます。

この記事は役に立ちましたか?
改善できる点がありましたらお聞かせください。