GoogleアナリティクスやAngelfish Softwareでフィルタの作成、検索の実行、目標の設定を行う場合、正規表現の基本的な理解が必要です。 この記事は基本的な復習です。

自作の正規表現をテストするには、無料の regex テスターを使用してください。

正規表現とは? Google Analyticsでは、正規表現を使用して、特定のパターンに一致するものを見つけることができます。 たとえば、サブディレクトリ内のすべてのページや、10 文字以上のクエリ文字列を持つすべてのページを検索できます。

正規表現では、文字、数字、特殊文字を組み合わせて、パターンがどのように見えるかを示す強力かつ柔軟な方法を使用できます。 たとえば、次のページが返されます:

  • /index.html
  • /html-definitions.php
  • /search.php?q=html+vs+php

The Escape Character: バックスラッシュ

正規表現では、特定の意味を持つ一連の特殊文字が使用されます。 これは、完全ではありませんが、非文字通りの意味を持つ正規表現の特殊文字の完全なリストです。

^ $ . ? () + \

例として、疑問符は正規表現において「前の文字を省略可能にする」ことを意味します。 この記事の後半で実際の例を紹介します。

しかし、クエスチョンマークを検索したい場合、クエスチョンマークの正規表現解釈を「エスケープ」する必要があります。 このためには、次のようにクエスチョンマークの直前にバックスラッシュを付けます:

\?

ピリオド文字にマッチしたい場合、その前にバックスラッシュを付けてエスケープします。 たとえば、\.html はドットの後に文字列 “html” が続く場合にマッチします。

一連の特殊文字を連続してマッチさせたい場合は、それぞれを個別にエスケープすればよいのです。 例えば、”$? “にマッチするには、$\?と入力します。

どんな特殊文字もバックスラッシュでエスケープすることができます – バックスラッシュも! \\ 正規表現は、文字列の先頭、中間、末尾のいずれかに出現すれば、指定したパターンにマッチします。 regex で使用できるアンカーは、パターンが最初か最後だけに現れるように指定するために使用します。 アンカー文字は次のとおりです:

^ $

パターンを先頭に固定するには、キャレット記号 (^) を使用します。 ドル記号($)は、パターンを末尾に固定するために使用します。

^/page は “/pages.html”, “/page/site.php” および “/page” にマッチします。

^car$ は “car” にのみマッチし、^$ は空の文字列にのみマッチします。

$/google.php^ は不正な正規表現なので何もマッチしません – キャレットは常にドルの左側にあるべきです。 ^/google.php$

文字の範囲

正規表現は文字の範囲や組み合わせにマッチするように使用することもできます。 角括弧を使用すると、文字列の特定の位置に現れるさまざまな文字を指定できます。

たとえば、 は “e”, “i” または “o” のいずれかと一致します。 例:

は a から z までの小文字にマッチします。(Google Analytics はデフォルトで大文字と小文字を区別しません)

は小文字、大文字、数字にマッチします。

は a, b, c, d, X, Y、Z のいずれかにマッチします。

角括弧は単語全体ではなく、個々の文字を見ます。

は “w”, “o”, “r”, “d” のいずれかにマッチします。

文字列にマッチするには、それらを括弧で囲んで、パイプ (|) を “or” 文字として使用します。 たとえば、「cat」または「dog」のインスタンスに一致させるには、次のように入力します:

(cat)|(dog) OR (cat|dog).

最後に、任意の文字に一致させるには、ピリオドを使用します。

car.s は “carrs”、”car?s”、”car5s” などにマッチします。

パターンの繰り返し

正規表現では、パターンが発生する回数を指定することもできます。

aa?pple は “aapple” または “apple” にマッチします。

プラス記号は1つ以上の出現にマッチします。

a+ は “a”, “aa”, “aaaaaaaa” などにマッチします。

アスタリスクは前の文字がゼロまたは多くマッチすることを示します。 ピリオドと組み合わせた「.*」は、何にでもマッチするため、一般的にワイルドカードとして使用されます。

.* は、空でない文字列にマッチします。

カーリーブラケットは、特定の出現範囲にマッチします。

ca{3,5}t は “caaat”, “caaaat”, “caaaaat” にマッチしますが、”cat” や “caaaaaaat” にはマッチしません。

次のステップ

Free regex tester で独自の正規表現をテストしてください。 このページをブックマークするのも自由です。

Articles

コメントを残す

メールアドレスが公開されることはありません。