Dacă doriți să creați filtre, să efectuați căutări sau să configurați obiective în Google Analytics sau Angelfish Software, aveți nevoie de o înțelegere de bază a expresiilor regulate. Acest articol este o reîmprospătare de bază.
Vă rugăm să folosiți testerul nostru gratuit de regex pentru a vă testa propriile expresii regulate.
Ce sunt expresiile regulate?
Expresiile regulate (cunoscute și sub numele de regex) sunt folosite pentru a găsi modele specifice într-o listă. În Google Analytics, regex-urile pot fi utilizate pentru a găsi orice se potrivește cu un anumit model. De exemplu, puteți găsi toate paginile dintr-un subdirector sau toate paginile cu un șir de interogare cu o lungime mai mare de zece caractere.
Expresiile regulate oferă o modalitate puternică și flexibilă de a descrie cum ar trebui să arate tiparul, folosind o combinație de litere, numere și caractere speciale.
De exemplu, dacă se tastează html
în caseta de căutare din rapoartele de conținut, se vor returna toate URL-urile care conțin „html” oriunde în cale. De exemplu, vor fi returnate următoarele pagini:
- /index.html
- /html-definitions.php
- /search.php?q=html+vs+php
Caracterul de evacuare: Backslash
Expresiile regulate utilizează o serie de caractere speciale care au semnificații specifice. Aceasta este o listă amănunțită, dar nu completă, a caracterelor speciale din regex care poartă o semnificație non-literală.
^ $ . ? () + \
Ca exemplu, semnul de întrebare înseamnă „fă caracterul anterior opțional” în regex. Vom arăta un exemplu de acest lucru în acțiune mai târziu în acest articol.
Dar dacă doriți să căutați un semn de întrebare, trebuie să „scăpați” interpretarea regex a semnului de întrebare. Realizați acest lucru punând o backslash chiar înainte de semnul de întrebare, astfel:
\?
Dacă doriți să potriviți caracterul punct, scăpați-l prin adăugarea unei backslash înainte de acesta. De exemplu, \.html
s-ar potrivi cu un punct urmat de șirul „html”.
Dacă doriți să potriviți o serie de caractere speciale la rând, scăpați-le pe fiecare în parte. Pentru a se potrivi cu „$?”, ați tasta $\?
.
Puteți scăpa orice caracter special cu o backslash – chiar și backslash-ul! \
Dacă nu sunteți sigur dacă un caracter este un caracter special sau nu, îl puteți scăpa fără consecințe negative.
Ancore: Caret și Dollar
Expresiile regulate se potrivesc cu modelul pe care îl specificați dacă apar oriunde în șirul de caractere – la început, la mijloc sau la sfârșit. Există ancore pe care le puteți utiliza în regex pentru a specifica faptul că un model trebuie să apară numai la început sau la sfârșit. Caracterele de ancorare sunt:
^ $
Utilizați simbolul caret (^) pentru a ancora un model la început. Utilizați un semn de dolar ($) pentru a ancora un model la sfârșit. Puteți folosi oricare dintre ele sau ambele într-un
^/page
se va potrivi cu „/pages.html”, „/page/site.php” și „/page”. Nu se va potrivi cu „/site/page” sau „/pag/es.html”.
^car$
se va potrivi doar cu „car”, iar ^$
se va potrivi doar cu șiruri de caractere goale.
$/google.php^
nu se va potrivi cu nimic, deoarece este un regex greșit – carțul ar trebui să fie întotdeauna în stânga dolarului: ^/google.php$
Rânduri de caractere
Regex-ul poate fi folosit, de asemenea, pentru a se potrivi cu intervale sau combinații de caractere. Parantezele pătrate vă permit să specificați o varietate de caractere care pot apărea într-o anumită poziție în șirul de caractere.
De exemplu, s-ar potrivi fie cu „e”, fie cu „i”, fie cu „o”.
Puteți include o listă lungă de caractere în paranteze pătrate, dar este mai ușor să potriviți un interval de caractere cu o cratimă. De exemplu:
se va potrivi cu orice literă minusculă de la a la z. (Google Analytics nu ține cont de majuscule și minuscule în mod implicit.)
se va potrivi cu orice literă minusculă, majusculă sau număr.
se va potrivi cu a, b, c, d, X, Y, sau Z.
Parantezele pătrate se uită la fiecare caracter în parte, nu la cuvinte întregi.
se potrivește cu o singură apariție a lui „w”, „o”, „r” sau „d”.
Pentru a potrivi un șir de caractere, închideți-le între paranteze și folosiți o pipă (|) ca un caracter „sau”. De exemplu, pentru a potrivi o instanță de „cat” sau „dog”, veți tasta:
(cat)|(dog) OR (cat|dog)
.
În cele din urmă, utilizați un punct pentru a potrivi orice caracter. Este ca un fel de wildcard pentru un singur caracter:
car.s
se va potrivi cu „carrs”, „car?s”, „car5s”, etc.
Repeating Patterns
Cu regex, puteți specifica chiar și numărul de apariții ale unui model.
Un semn de întrebare după un caracter se va potrivi cu zero sau o singură apariție a caracterului respectiv. Acest lucru face caracterul opțional:
aa?pple
se va potrivi cu „aapple” sau „apple”.
Un semn plus se potrivește cu una sau mai multe apariții.
a+
se va potrivi cu „a”, „aa”, „aaaaaaaaaa”, etc.
Un asterisc se potrivește cu zero sau mai multe apariții ale caracterului anterior. Combinat cu un punct, „.*” este utilizat în mod obișnuit ca wildcard, deoarece se potrivește cu orice.
.*
se va potrivi cu orice șiruri de caractere care nu sunt goale.
Curly brackets vă permite să potriviți un anumit interval de apariții. Specificați numărul minim și maxim de apariții.
ca{3,5}t
se va potrivi cu „caaat”, „caaaat”, „caaaaat”, dar nu și cu „cat” sau „caaaaaaaaat”.
Pași următori
Utilizați testerul nostru gratuit de regex pentru a vă testa propriile expresii regulate. Nu ezitați să adăugați și pagina la favorite!
.