Ha szűrőket szeretne létrehozni, kereséseket végezni vagy célokat beállítani a Google Analyticsben vagy az Angelfish szoftverben, akkor alapszintű ismeretekre van szüksége a reguláris kifejezésekről. Ez a cikk egy alapvető felfrissítés.
Kérjük, használja ingyenes regex tesztelőnket, hogy tesztelje saját reguláris kifejezéseit.
Mi a reguláris kifejezések?
A reguláris kifejezések (más néven regex) arra szolgálnak, hogy egy listában meghatározott mintákat találjunk. A Google Analyticsben a regexek segítségével bármit meg lehet találni, ami megfelel egy bizonyos mintának. Például egy alkönyvtáron belül minden oldalt megkereshet, vagy minden olyan oldalt, amelynek lekérdezési karakterlánca tíz karakternél hosszabb.
A szabályos kifejezések hatékony és rugalmas módot biztosítanak a minta leírására, betűk, számok és speciális karakterek kombinációjával.
Például a html
beírása a tartalomjelentések keresőmezőjébe minden olyan URL-t visszaad, amely a “html” szót tartalmazza bárhol az elérési útvonalban. Például a következő oldalakat kapná vissza:
- /index.html
- /html-definitions.php
- /search.php?q=html+vs+php
A menekülő karakter: Backslash
A szabályos kifejezések egy sor speciális karaktert használnak, amelyek meghatározott jelentést hordoznak. Ez egy alapos, de nem teljes lista a regexben használt, nem szó szerinti jelentést hordozó speciális karakterekről.
^ $ . ? () + \
A kérdőjel például azt jelenti a regexben, hogy “az előző karaktert választhatóvá kell tenni”. Erre a cikk későbbi részében mutatunk egy példát a gyakorlatban.
De ha kérdőjelet akarunk keresni, akkor a kérdőjel regex értelmezését kell “kikerülni”. Ezt úgy érhetjük el, hogy közvetlenül a kérdőjel elé teszünk egy backslash-t, például így:
\?
Ha a pont karakterre akarunk keresni, akkor a pont előtt egy backslash-t teszünk ki. Például a \.html
egy pontra illeszkedik, amelyet a “html” karakterlánc követ.
Ha egy sor speciális karaktert szeretne egy sorba illeszteni, csak lépjen ki mindegyikből külön-külön. A “$?”-ra való megfeleltetéshez a $\?
.
Minden speciális karaktert kikerülhet backslash-szel – még a backslash-t is! \\
Ha nem biztos benne, hogy egy karakter speciális karakter-e vagy sem, akkor minden negatív következmény nélkül kikerülheti azt.
Anchors:
A szabályos kifejezések megfelelnek a megadott mintának, ha bárhol előfordulnak a karakterláncban – a karakterlánc elején, közepén vagy végén. Vannak horgonyok, amelyekkel a regexben megadhatja, hogy egy minta csak az elején vagy a végén forduljon elő. A horgonyzó karakterek a következők:
^ $
A caret szimbólum (^) használatával a mintát az elejére rögzítheti. A dollárjel ($) használatával a mintát a végéhez rögzítheti. Használhatja bármelyiket vagy mindkettőt a
^/page
a “/pages.html”, a “/page/site.php” és a “/page” jelekre fog illeszkedni. A “/site/page” vagy a “/pag/es.html” nem fog megfelelni.
^car$
csak az “car”-ra fog megfelelni, a ^$
pedig csak üres karakterláncokra.
$/google.php^
nem fog megfelelni semmire, mert ez rossz regex – a caretnek mindig a dollár bal oldalán kell lennie: ^/google.php$
Karaktertartományok
A regex használható karaktertartományok vagy -kombinációk egyeztetésére is. A szögletes zárójelek lehetővé teszik, hogy többféle karaktert adjon meg, amelyek a karakterlánc egy bizonyos pozíciójában előfordulhatnak.
A például az “e”, “i” vagy “o” karakterekre illeszkedik.
A szögletes zárójelekbe karakterek hosszú listáját is beírhatja, de könnyebb egy karaktertartományt kötőjellel illeszteni. Például:
bármely kisbetűs betűre megfelel a-tól z-ig. (A Google Analytics alapértelmezés szerint nem érzékeny a nagy- és kisbetűkre.)
bármely kisbetűre, nagybetűre vagy számra megfelel.
az a, b, c, d, X, Y vagy Z betűre.
A szögletes zárójelek minden egyes karaktert megvizsgálnak, nem pedig egész szavakat.
a “w”, “o”, “r” vagy “d” egyetlen előfordulására illik.
Helyes karakterláncok illesztéséhez zárójelbe kell zárni őket, és “vagy” karakterként pipát (|) kell használni. Például a “macska” vagy a “kutya” egyezéséhez a következőt kell beírni:
(cat)|(dog) OR (cat|dog)
.
Végül használjon pontot bármely karakterrel való egyezéshez. Ez olyan, mint egy joker egy karakterhez:
car.s
a “carrs”, “car?s”, “car5s” stb.
Minták ismétlése
A regexszel még azt is megadhatja, hogy egy minta hányszor forduljon elő.
A kérdőjel egy karakter után a karakter nulla vagy egy előfordulásával egyezik meg. Ezáltal a karakter opcionálissá válik:
aa?pple
az “aapple” vagy “apple” karakterrel egyezik meg.
A pluszjel az “a”, “aa”, “aaaaaaaaaaaa”, stb.
a+
egy csillag az előző karakter nulla vagy több előfordulásával egyezik meg.
A csillag az előző karakterrel egyezik meg. Egy ponttal kombinálva a “.*” általában jokerként használatos, mert bármihez illeszkedik.
.*
Minden nem üres karakterlánchoz illeszkedik.
A szögletes zárójelek lehetővé teszik, hogy az előfordulások egy adott tartományához illeszkedjen. Megadhatja az előfordulások minimális és maximális számát.
ca{3,5}t
megfelel a “caaat”, “caaaat”, “caaaaat”, “caaaaat”, de a “cat” vagy “caaaaaaaaaaaaat” nem.
Következő lépések
A saját reguláris kifejezések teszteléséhez használja ingyenes regex tesztelőnket. Nyugodtan tegye könyvjelzőbe az oldalt is!