Jos haluat luoda suodattimia, tehdä hakuja tai asettaa tavoitteita Google Analyticsissa tai Angelfish-ohjelmistossa, tarvitset perustiedot säännöllisistä lausekkeista. Tämä artikkeli on perusasioiden kertausta.

Käytä ilmaista regex-testeriämme testataksesi omia säännöllisiä lausekkeita.

Mitä ovat säännölliset lausekkeet?

Säännöllisiä lausekkeita (tunnetaan myös nimellä regex) käytetään tiettyjen kuvioiden etsimiseen luettelosta. Google Analyticsissa regexien avulla voidaan etsiä kaikkea, mikä vastaa tiettyä kuviota. Voit esimerkiksi etsiä kaikki sivut alihakemiston sisällä tai kaikki sivut, joiden kyselymerkkijono on yli kymmenen merkkiä pitkä.

Regulaarilausekkeet tarjoavat tehokkaan ja joustavan tavan kuvata, miltä kuvion pitäisi näyttää, käyttämällä kirjainten, numeroiden ja erikoismerkkien yhdistelmää.

Kirjoittamalla esimerkiksi html sisältöraporttien hakukenttään palautetaan kaikki URL-osoitteet, jotka sisältävät ”html”-merkkiä jossakin kohdassa polussa. Esimerkiksi seuraavat sivut palautettaisiin:

  • /index.html
  • /html-definitions.php
  • /search.php?q=html+vs+php

Espacemerkki: Backslash

Säännöllisissä lausekkeissa käytetään useita erikoismerkkejä, joilla on tiettyjä merkityksiä. Tämä on perusteellinen, mutta ei täydellinen, luettelo regexissä käytettävistä erikoismerkeistä, joilla on muu kuin kirjaimellinen merkitys.

^ $ . ? () + \

Kysymysmerkki tarkoittaa esimerkiksi regexissä ”tee edellisestä merkistä valinnainen”. Näytämme tästä esimerkin käytännössä myöhemmin tässä artikkelissa.

Mutta jos haluat hakea kysymysmerkkiä, sinun täytyy ”paeta” kysymysmerkin regex-tulkintaa. Tämä onnistuu laittamalla backslash-merkki juuri ennen kysymysmerkkiä, esimerkiksi näin:

\?

Jos haluat etsiä piste-merkkiä, pakene se lisäämällä backslash-merkki ennen sitä. Esimerkiksi \.html sopisi pisteeseen, jota seuraa merkkijono ”html”.

Jos haluat sopia sarjan erikoismerkkejä peräkkäin, pakene vain jokainen merkki erikseen. Sopiaksesi ”$?”, kirjoittaisit $\?.

Voit paeta mitä tahansa erikoismerkkiä backslashilla – jopa backslashia! \\

Jos et ole varma, onko jokin merkki erikoismerkki vai ei, voit välttää sen ilman kielteisiä seurauksia.

Ankkurit: Caret ja Dollar

Säännölliset lausekkeet vastaavat määrittelemääsi mallia, jos ne esiintyvät missä tahansa merkkijonossa – alussa, keskellä tai lopussa. On olemassa ankkureita, joita voit käyttää regexissä määrittääksesi, että kuvio esiintyy vain alussa tai lopussa. Ankkurimerkit ovat:

^ $

Käytä caret-symbolia (^) ankkuroidaksesi kuvion alkuun. Käytä dollarimerkkiä ($) ankkuroidaksesi kuvion loppuun. Voit käyttää jompaakumpaa tai molempia

^/page vastaa ”/pages.html”, ”/page/site.php” ja ”/page”. Se ei sovi ”/site/page” tai ”/pag/es.html”.

^car$ sopii vain ”car” ja ^$ sopii vain tyhjiin merkkijonoihin.

$/google.php^ ei sovi mihinkään, koska se on huonoa regexiä – caretin pitäisi aina olla dollarin vasemmalla puolella: ^/google.php$

Merkkialueet

Regexiä voidaan käyttää myös merkkialueiden tai merkkiyhdistelmien tarkistamiseen. Aaltosulkeiden avulla voit määrittää erilaisia merkkejä, jotka voivat esiintyä tietyssä kohdassa merkkijonossa.

Esimerkiksi vastaa joko ”e”, ”i” tai ”o”.

Aaltosulkeisiin voi sisällyttää pitkän luettelon merkkejä, mutta on helpompaa sovittaa merkkijono väliviivalla. Esimerkiksi:

vastaa mitä tahansa pientä kirjainta a:sta z:hen. (Google Analytics ei oletusarvoisesti huomioi isoja ja pieniä kirjaimia.)

vastaa mitä tahansa pientä kirjainta, isoa kirjainta tai numeroa.

vastaa a, b, c, d, X, Y tai Z.

Sulkeissa tarkastellaan jokaista yksittäistä merkkiä, ei kokonaisia sanoja.

vastaa merkkien ”w”, ”o”, ”r” tai ”d” yksittäistä esiintymää.

Voidaksesi vastata merkkijonoa, sulje ne sulkuihin ja käytä piippua (|) ”tai”-merkkinä. Jos haluat esimerkiksi löytää ”kissan” tai ”koiran”, kirjoita:

(cat)|(dog) OR (cat|dog).

Käytä lopuksi pistettä, jos haluat löytää minkä tahansa merkin. Se on kuin yksittäisen merkin jokerimerkki:

car.s vastaa ”carrs”, ”car?s”, ”car5s” jne.

Kuvioiden toistaminen

Regexillä voit jopa määrittää, kuinka monta kertaa kuvio tulee esiintyä.

Kysymysmerkki merkin jälkeen vastaa merkin nollaa tai yhtä esiintymistä. Tämä tekee merkistä valinnaisen:

aa?pple vastaa merkkiä ”aapple” tai ”apple”.

Plusmerkki vastaa yhtä tai useampaa esiintymää.

a+ vastaa merkkejä ”a”, ”aa”, ”aaaaaaaaaaaaaa” jne.

Tähti vastaa nollaa tai useampaa edellistä merkkiä. Yhdistettynä pisteeseen ”.*” käytetään yleisesti jokerimerkkinä, koska se sopii mihin tahansa.

.* sopii kaikkiin ei-tyhjiin merkkijonoihin.

Sulkeisten hakasulkeiden avulla voit sovittaa tietyn esiintymisalueen. Määrität esiintymien minimi- ja maksimimäärän.

ca{3,5}t vastaa sanoja ”caaat”, ”caaaat”, ”caaaaat”, ”caaaaat”, mutta ei sanoja ”cat” tai ”caaaaaaaaaaat”.

Seuraavat vaiheet

Käytä ilmaista regex-testeriä testataksesi omia säännöllisiä lausekkeita. Voit myös vapaasti merkitä sivun kirjanmerkkeihin!

Articles

Vastaa

Sähköpostiosoitettasi ei julkaista.