Als u filters wilt maken, zoekopdrachten wilt uitvoeren of doelen wilt instellen in Google Analytics of Angelfish Software, hebt u een basiskennis nodig van reguliere expressies. Dit artikel is een basis opfrisser.

Gebruik onze gratis regex tester om uw eigen reguliere expressies te testen.

Wat zijn Reguliere Expressies?

Reguliere expressies (ook bekend als regex) worden gebruikt om specifieke patronen in een lijst te vinden. In Google Analytics kunnen regex worden gebruikt om alles te vinden dat overeenkomt met een bepaald patroon. U kunt bijvoorbeeld alle pagina’s binnen een subdirectory vinden, of alle pagina’s met een querystring van meer dan tien tekens.

Reguliere expressies bieden een krachtige en flexibele manier om te beschrijven hoe het patroon eruit moet zien, met behulp van een combinatie van letters, cijfers en speciale tekens.

Typ bijvoorbeeld html in het zoekvak in de inhoudsrapporten zal alle URL’s retourneren die “html” ergens in het pad bevatten. De volgende pagina’s zouden bijvoorbeeld worden geretourneerd:

  • /index.html
  • /html-definitions.php
  • /search.php?q=html+vs+php

Het Escape teken: Backslash

Reguliere expressies gebruiken een reeks speciale tekens die een specifieke betekenis hebben. Dit is een grondige, maar niet volledige, lijst van de speciale tekens in regex die een niet letterlijke betekenis hebben.

^ $ . ? () + \

Het vraagteken betekent bijvoorbeeld “maak het vorige teken optioneel” in regex. We zullen later in dit artikel een voorbeeld hiervan in actie laten zien.

Maar als u wilt zoeken naar een vraagteken, moet u de regex-interpretatie van het vraagteken “escapen”. Dit doe je door een backslash net voor het vraagteken te zetten, zoals dit:

\?

Als je wilt zoeken op het teken punt, escape je dit door er een backslash voor te zetten. \.html zou bijvoorbeeld overeenkomen met een punt gevolgd door de tekenreeks “html”.

Als u een reeks speciale tekens achter elkaar wilt gebruiken, escape dan elk teken afzonderlijk. Om overeen te komen met “$?”, typt u $\?.

U kunt elk speciaal teken escapen met een backslash – zelfs de backslash!

Als u niet zeker weet of een teken een speciaal teken is of niet, kunt u het zonder nadelige gevolgen escapen.

Ankers: Caret en Dollar

Reguliere uitdrukkingen komen overeen met het patroon dat u opgeeft als ze ergens in de tekenreeks voorkomen-begin, midden of einde. Er zijn ankers die u in regex kunt gebruiken om aan te geven dat een patroon alleen aan het begin of het eind mag voorkomen. De ankertekens zijn:

^ $

Gebruik het caret symbool (^) om een patroon aan het begin te verankeren. Gebruik een dollarteken ($) om een patroon aan het eind te verankeren. U kunt een van beide of beide gebruiken in een

^/page komt overeen met “/pages.html”, “/page/site.php” en “/page”. Het zal niet overeenkomen met “/site/page” of “/pag/es.html”.

^car$ zal alleen overeenkomen met “auto” en ^$ zal alleen overeenkomen met lege strings.

$/google.php^ zal met niets overeenkomen omdat het slechte regex is – de caret moet altijd aan de linkerkant van de dollar staan: ^/google.php$

Rekenreeksen van tekens

Regex kan ook worden gebruikt om reeksen of combinaties van tekens te matchen. Met vierkante haken kunt u een reeks tekens specificeren die op een bepaalde positie in de tekenreeks kunnen voorkomen.

Voorbeeld, zou overeenkomen met ofwel “e”, “i” of “o”.

U kunt een lange lijst van tekens tussen vierkante haken zetten, maar het is gemakkelijker om een reeks tekens te matchen met een koppelteken. Bijvoorbeeld:

komt overeen met elke kleine letter van a tot z. (Google Analytics is standaard hoofdletterongevoelig.)

komt overeen met elke kleine letter, hoofdletter of cijfer.

komt overeen met a, b, c, d, X, Y, of Z.

Haakjes kijken naar elk individueel teken, niet naar hele woorden.

komt overeen met een enkel voorkomen van “w”, “o”, “r” of “d”.

Om overeen te komen met een tekenreeks, sluit u deze in tussen haakjes en gebruikt u een pijp (|) als een “of”-teken. Om bijvoorbeeld overeen te komen met “cat” of “dog”, typt u:

(cat)|(dog) OR (cat|dog).

Tot slot kunt u een punt gebruiken om overeen te komen met elk teken. Het is als een wildcard voor een enkel teken:

car.s komt overeen met “carrs”, “car?s”, “car5s”, enz.

Herhalende patronen

Met regex kunt u zelfs het aantal keren opgeven dat een patroon moet voorkomen.

Een vraagteken na een teken komt overeen met nul of één keer dat het teken voorkomt. Dit maakt het teken optioneel:

aa?pple komt overeen met “aappel” of “appel”.

Een plusteken komt overeen met één of meer voorkomens.

a+ komt overeen met “a”, “aa”, “aaaaaaaaaa”, enz.

Een sterretje komt overeen met nul of meer voorkomens van het vorige teken. In combinatie met een punt wordt “.*” vaak als jokerteken gebruikt omdat het met alles overeenkomt.

.* komt overeen met alle niet-lege tekenreeksen.

Met accolades kunt u een specifiek bereik van voorkomen overeenkomen.

ca{3,5}t komt overeen met “caaat”, “caaaat”, “caaaaat”, maar niet met “cat” of “caaaaaaaaat”.

Volgende stappen

Gebruik onze gratis regex tester om je eigen reguliere expressies te testen. Voel je ook vrij om Bladwijzer van de pagina te maken.

Articles

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.