Jeśli chcesz tworzyć filtry, wykonywać wyszukiwania lub ustawiać cele w Google Analytics lub oprogramowaniu Angelfish, potrzebujesz podstawowego zrozumienia wyrażeń regularnych. Ten artykuł jest podstawowym odświeżeniem.
Użyj naszego darmowego testera regex, aby przetestować własne wyrażenia regularne.
Co to są wyrażenia regularne?
Wyrażenia regularne (znane również jako regex) są używane do znajdowania określonych wzorców na liście. W Google Analytics, regex może być użyte do znalezienia wszystkiego, co pasuje do określonego wzorca. Na przykład, można znaleźć wszystkie strony w obrębie podkatalogu lub wszystkie strony z łańcuchem zapytania dłuższym niż dziesięć znaków.
Wyrażenia regularne zapewniają potężny i elastyczny sposób na opisanie, jak powinien wyglądać wzorzec, używając kombinacji liter, cyfr i znaków specjalnych.
Na przykład, wpisanie html
w polu wyszukiwania w raportach treści zwróci wszystkie adresy URL, które zawierają „html” w dowolnym miejscu ścieżki. Na przykład, zwrócone zostaną następujące strony:
- /index.html
- /html-definitions.php
- /search.php?q=html+vs+php
Znak ucieczki: Backslash
Regularne wyrażenia wykorzystują serię znaków specjalnych, które niosą ze sobą określone znaczenia. To jest dokładna, ale nie kompletna lista znaków specjalnych w regex, które mają znaczenie nieliteralne.
^ $ . ? () + \
Na przykład, znak zapytania oznacza w regex „uczyń poprzedni znak opcjonalnym”. Pokażemy tego przykład w działaniu w dalszej części artykułu.
Jeśli jednak chcesz wyszukać znak zapytania, musisz „uciec” od regexowej interpretacji znaku zapytania. Można to osiągnąć przez umieszczenie odwrotnego ukośnika tuż przed znakiem zapytania, jak poniżej:
\?
Jeśli chcesz dopasować znak kropki, uciec od niego przez dodanie odwrotnego ukośnika przed nim. Na przykład, \.html
dopasowałoby kropkę, po której następuje łańcuch „html”.
Jeśli chcesz dopasować serię znaków specjalnych w rzędzie, po prostu uciekaj od każdego z nich z osobna. Aby dopasować „$?”, wpisałbyś $\?
.
Możesz uciec od każdego znaku specjalnego za pomocą odwrotnego ukośnika – nawet od odwrotnego ukośnika!
Jeśli nie jesteś pewien, czy znak jest znakiem specjalnym, czy nie, możesz go uciec bez żadnych negatywnych konsekwencji.
Anchory: Caret i Dollar
Wyrażenia regularne pasują do określonego przez Ciebie wzorca, jeśli występują w dowolnym miejscu łańcucha – na początku, w środku lub na końcu. Istnieją kotwice, których można użyć w wyrażeniu regex, aby określić, że wzorzec powinien wystąpić tylko na początku lub na końcu. Znaki zakotwiczenia to:
^ $
Użyj symbolu daszka (^), aby zakotwiczyć wzorzec na początku. Użyj znaku dolara ($), aby zakotwiczyć wzorzec na końcu. Możesz użyć obu lub jednego z tych znaków w pliku
^/page
Pasuje do „/pages.html”, „/page/site.php” i „/page”. Nie będzie pasować do „/site/page” lub „/pag/es.html”.
^car$
będzie pasować tylko do „car”, a ^$
będzie pasować tylko do pustych ciągów znaków.
$/google.php^
nie będzie pasować do niczego, ponieważ jest to zły regex – caret powinien zawsze być na lewo od dolara: ^/google.php$
Zakresy znaków
Regex może być również używany do dopasowywania zakresów lub kombinacji znaków. Nawiasy kwadratowe pozwalają na określenie różnych znaków, które mogą pojawić się w określonej pozycji w łańcuchu.
Na przykład, będzie pasować do „e”, „i” lub „o”.
Możesz zawrzeć długą listę znaków w nawiasach kwadratowych, ale łatwiej jest dopasować zakres znaków za pomocą myślnika. Na przykład:
będzie pasować do każdej małej litery od a do z. (Google Analytics domyślnie nie uwzględnia wielkości liter.)
będzie pasować do każdej małej, dużej litery lub liczby.
będzie pasować do a, b, c, d, X, Y lub Z.
Nawiasy kwadratowe patrzą na każdy pojedynczy znak, a nie na całe słowa.
dopasowuje pojedyncze wystąpienie „w”, „o”, „r” lub „d”.
Aby dopasować ciąg znaków, należy ująć je w nawiasy i użyć rury (|) jako znaku „lub”. Na przykład, aby dopasować instancję „kota” lub „psa”, wpiszesz:
(cat)|(dog) OR (cat|dog)
.
Na koniec, użyj kropki, aby dopasować dowolny znak. Jest to jak symbol wieloznaczny dla pojedynczego znaku:
car.s
pasuje do „carrs”, „car?s”, „car5s”, itd.
Powtarzające się wzorce
W przypadku regex, możesz nawet określić liczbę wystąpień wzorca.
Znak zapytania po znaku dopasuje zero lub jedno wystąpienie tego znaku. To sprawia, że znak jest opcjonalny:
aa?pple
dopasowuje „aapple” lub „apple”.
Znak plusa dopasowuje jedno lub więcej wystąpień.
a+
dopasowuje „a”, „aa”, „aaaaaaaaaa”, itd.
Gwiazdka dopasowuje zero lub więcej wystąpień poprzedniego znaku. W połączeniu z kropką, „.*” jest powszechnie używany jako symbol wieloznaczny, ponieważ pasuje do wszystkiego.
.*
Dopasowuje wszelkie niepuste ciągi znaków.
Nawiasy klamrowe pozwalają dopasować określony zakres wystąpień. Określasz minimalną i maksymalną liczbę wystąpień.
ca{3,5}t
dopasuje „caaat”, „caaaat”, „caaaaat”, ale nie „cat” lub „caaaaaaaaat”.
Następne kroki
Użyj naszego darmowego testera regex, aby przetestować swoje własne wyrażenia regularne. Zachęcamy również do dodania zakładek do tej strony!