Se quiser criar filtros, realizar pesquisas ou definir objectivos no Google Analytics ou no Software Angelfish, precisa de uma compreensão básica das expressões regulares. Este artigo é uma atualização básica.
Por favor use nosso testador regex gratuito para testar suas próprias expressões regulares.
O que são expressões regulares?
Expressões regulares (também conhecidas como regex) são usadas para encontrar padrões específicos em uma lista. No Google Analytics, regex pode ser usado para encontrar qualquer coisa que corresponda a um determinado padrão. Por exemplo, você pode encontrar todas as páginas dentro de um subdiretório, ou todas as páginas com uma query string com mais de dez caracteres.
Expressões regulares fornecem uma maneira poderosa e flexível de descrever como o padrão deve ser, usando uma combinação de letras, números e caracteres especiais.
Por exemplo, digitando html
na caixa de busca nos relatórios de conteúdo retornará todas as URLs que contenham “html” em qualquer lugar do caminho. Por exemplo, as seguintes páginas seriam retornadas:
- /index.html
- /html-definitions.php
- /search.php?q=html+vs+php
The Escape Character: Backslash
Expressões regulares usam uma série de caracteres especiais que carregam significados específicos. Esta é uma lista completa, mas não completa, dos caracteres especiais em regex que carregam um significado não literal.
^ $ . ? () + \
Como exemplo, o ponto de interrogação significa “tornar o caractere anterior opcional” em regex. Vamos mostrar um exemplo disso em ação mais tarde neste artigo.
Mas se você quiser pesquisar um ponto de interrogação, você precisa “escapar” da interpretação regex do ponto de interrogação. Você consegue isso colocando uma barra invertida um pouco antes do ponto de interrogação, assim:
\?
Se você quiser combinar o caractere de período, escape a ele adicionando uma barra invertida antes dele. Por exemplo, \.html
corresponderia a um ponto seguido da string “html”.
Se você quiser corresponder a uma série de caracteres especiais em uma linha, basta escapar de cada um individualmente. Para combinar “$?”, você digitaria $\?
.
Você pode escapar de qualquer caractere especial com uma contrabarra – mesmo a contrabarra!
Se você não tiver certeza se um personagem é um personagem especial ou não, você pode escapar dele sem nenhuma consequência negativa.
Ancoras: Caret e Dollar
Expressões regulares correspondem ao padrão que você especificar se elas ocorrem em qualquer lugar no início, meio ou fim da string. Há âncoras que você pode usar no regex para especificar que um padrão só deve ocorrer no início ou no fim. Os caracteres de âncora são:
^ $
Utilizar o símbolo do carpete (^) para ancorar um padrão ao início. Use um sinal de dólar ($) para ancorar um padrão ao fim. Você pode usar um ou ambos em um
^/page
combinará com “/pages.html”, “/page/site.php” e “/page”. Não vai corresponder a “/site/page” ou “/pag/es.html”.
^car$
só vai corresponder a “car” e ^$
só vai corresponder a cordas vazias.
$/google.php^
não vai corresponder a nada porque é mau regex – o carpete deve estar sempre à esquerda do dólar: ^/google.php$
Intervalos de caracteres
Regex também pode ser usado para combinar intervalos ou combinações de caracteres. Parênteses rectos permitem-lhe especificar uma variedade de caracteres que podem aparecer numa determinada posição na string.
Por exemplo, corresponderia a “e”, “i” ou “o”.
Pode incluir uma longa lista de caracteres entre parênteses rectos, mas é mais fácil corresponder um intervalo de caracteres com um hífen. Por exemplo:
irá corresponder a qualquer letra minúscula de a a a z. (Google Analytics é insensível a maiúsculas e minúsculas por padrão.)
irá corresponder a qualquer letra minúscula, letra maiúscula ou número.
irá corresponder a, b, c, d, X, Y, ou Z.
Parênteses rectos olha para cada caractere individual, não palavras inteiras.
corresponde a uma única ocorrência de “w”, “o”, “r” ou “d”.
Para corresponder a uma sequência de caracteres, coloque-os entre parênteses e use um cano (|) como um caractere “ou”. Por exemplo, para combinar uma instância de “cat” ou “dog”, você digitaria:
(cat)|(dog) OR (cat|dog)
.
Finalmente, use um ponto para combinar qualquer caractere. É como um wildcard para um único caractere:
car.s
irá combinar com “carrs”, “car?s”, “car5s”, etc.
Padrão de repetição
Com regex, você pode até especificar o número de vezes que um padrão deve ocorrer.
Um ponto de interrogação após um caractere irá combinar com zero ou uma ocorrência do caractere. Isso torna o caractere opcional:
aa?pple
corresponderá a “aapple” ou “apple”.
A plus sign corresponde a uma ou mais ocorrências.
a+
corresponderá a “a”, “aa”, “aaaaaaaaaaa”, etc.
Um asterisco corresponde a zero ou a mais do caractere anterior. Combinado com um ponto, “.*” é comumente usado como curinga porque corresponde a qualquer coisa.
.*
irá corresponder a quaisquer cadeias não vazias.
Curly parênteses permitem-lhe corresponder a uma gama específica de ocorrências. Você especifica o número mínimo e máximo de ocorrências.
ca{3,5}t
irá corresponder a “caaat”, “caaaaat”, “caaaaat”, mas não “cat” ou “caaaaaaaaat”.
Passos seguintes
Utilize nosso testador regex livre para testar suas próprias expressões regulares. Sinta-se à vontade para marcar a página também!