Ha szűrőket szeretne létrehozni, kereséseket végezni vagy célokat beállítani a Google Analyticsben vagy az Angelfish szoftverben, akkor alapszintű ismeretekre van szüksége a reguláris kifejezésekről. Ez a cikk egy alapvető felfrissítés.

Kérjük, használja ingyenes regex tesztelőnket, hogy tesztelje saját reguláris kifejezéseit.

Mi a reguláris kifejezések?

A reguláris kifejezések (más néven regex) arra szolgálnak, hogy egy listában meghatározott mintákat találjunk. A Google Analyticsben a regexek segítségével bármit meg lehet találni, ami megfelel egy bizonyos mintának. Például egy alkönyvtáron belül minden oldalt megkereshet, vagy minden olyan oldalt, amelynek lekérdezési karakterlánca tíz karakternél hosszabb.

A szabályos kifejezések hatékony és rugalmas módot biztosítanak a minta leírására, betűk, számok és speciális karakterek kombinációjával.

Például a html beírása a tartalomjelentések keresőmezőjébe minden olyan URL-t visszaad, amely a “html” szót tartalmazza bárhol az elérési útvonalban. Például a következő oldalakat kapná vissza:

  • /index.html
  • /html-definitions.php
  • /search.php?q=html+vs+php

A menekülő karakter: Backslash

A szabályos kifejezések egy sor speciális karaktert használnak, amelyek meghatározott jelentést hordoznak. Ez egy alapos, de nem teljes lista a regexben használt, nem szó szerinti jelentést hordozó speciális karakterekről.

^ $ . ? () + \

A kérdőjel például azt jelenti a regexben, hogy “az előző karaktert választhatóvá kell tenni”. Erre a cikk későbbi részében mutatunk egy példát a gyakorlatban.

De ha kérdőjelet akarunk keresni, akkor a kérdőjel regex értelmezését kell “kikerülni”. Ezt úgy érhetjük el, hogy közvetlenül a kérdőjel elé teszünk egy backslash-t, például így:

\?

Ha a pont karakterre akarunk keresni, akkor a pont előtt egy backslash-t teszünk ki. Például a \.html egy pontra illeszkedik, amelyet a “html” karakterlánc követ.

Ha egy sor speciális karaktert szeretne egy sorba illeszteni, csak lépjen ki mindegyikből külön-külön. A “$?”-ra való megfeleltetéshez a $\?.

Minden speciális karaktert kikerülhet backslash-szel – még a backslash-t is! \\

Ha nem biztos benne, hogy egy karakter speciális karakter-e vagy sem, akkor minden negatív következmény nélkül kikerülheti azt.

Anchors:

A szabályos kifejezések megfelelnek a megadott mintának, ha bárhol előfordulnak a karakterláncban – a karakterlánc elején, közepén vagy végén. Vannak horgonyok, amelyekkel a regexben megadhatja, hogy egy minta csak az elején vagy a végén forduljon elő. A horgonyzó karakterek a következők:

^ $

A caret szimbólum (^) használatával a mintát az elejére rögzítheti. A dollárjel ($) használatával a mintát a végéhez rögzítheti. Használhatja bármelyiket vagy mindkettőt a

^/page a “/pages.html”, a “/page/site.php” és a “/page” jelekre fog illeszkedni. A “/site/page” vagy a “/pag/es.html” nem fog megfelelni.

^car$ csak az “car”-ra fog megfelelni, a ^$ pedig csak üres karakterláncokra.

$/google.php^ nem fog megfelelni semmire, mert ez rossz regex – a caretnek mindig a dollár bal oldalán kell lennie: ^/google.php$

Karaktertartományok

A regex használható karaktertartományok vagy -kombinációk egyeztetésére is. A szögletes zárójelek lehetővé teszik, hogy többféle karaktert adjon meg, amelyek a karakterlánc egy bizonyos pozíciójában előfordulhatnak.

A például az “e”, “i” vagy “o” karakterekre illeszkedik.

A szögletes zárójelekbe karakterek hosszú listáját is beírhatja, de könnyebb egy karaktertartományt kötőjellel illeszteni. Például:

bármely kisbetűs betűre megfelel a-tól z-ig. (A Google Analytics alapértelmezés szerint nem érzékeny a nagy- és kisbetűkre.)

bármely kisbetűre, nagybetűre vagy számra megfelel.

az a, b, c, d, X, Y vagy Z betűre.

A szögletes zárójelek minden egyes karaktert megvizsgálnak, nem pedig egész szavakat.

a “w”, “o”, “r” vagy “d” egyetlen előfordulására illik.

Helyes karakterláncok illesztéséhez zárójelbe kell zárni őket, és “vagy” karakterként pipát (|) kell használni. Például a “macska” vagy a “kutya” egyezéséhez a következőt kell beírni:

(cat)|(dog) OR (cat|dog).

Végül használjon pontot bármely karakterrel való egyezéshez. Ez olyan, mint egy joker egy karakterhez:

car.s a “carrs”, “car?s”, “car5s” stb.

Minták ismétlése

A regexszel még azt is megadhatja, hogy egy minta hányszor forduljon elő.

A kérdőjel egy karakter után a karakter nulla vagy egy előfordulásával egyezik meg. Ezáltal a karakter opcionálissá válik:

aa?pple az “aapple” vagy “apple” karakterrel egyezik meg.

A pluszjel az “a”, “aa”, “aaaaaaaaaaaa”, stb.

a+ egy csillag az előző karakter nulla vagy több előfordulásával egyezik meg.

A csillag az előző karakterrel egyezik meg. Egy ponttal kombinálva a “.*” általában jokerként használatos, mert bármihez illeszkedik.

.* Minden nem üres karakterlánchoz illeszkedik.

A szögletes zárójelek lehetővé teszik, hogy az előfordulások egy adott tartományához illeszkedjen. Megadhatja az előfordulások minimális és maximális számát.

ca{3,5}tmegfelel a “caaat”, “caaaat”, “caaaaat”, “caaaaat”, de a “cat” vagy “caaaaaaaaaaaaat” nem.

Következő lépések

A saját reguláris kifejezések teszteléséhez használja ingyenes regex tesztelőnket. Nyugodtan tegye könyvjelzőbe az oldalt is!

Articles

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.