Si desea crear filtros, realizar búsquedas o configurar objetivos en Google Analytics o Angelfish Software, necesita una comprensión básica de las expresiones regulares. Este artículo es un repaso básico.
Utiliza nuestro comprobador de expresiones regulares gratuito para probar tus propias expresiones regulares.
¿Qué son las expresiones regulares?
Las expresiones regulares (también conocidas como regex) se utilizan para encontrar patrones específicos en una lista. En Google Analytics, las expresiones regulares se pueden utilizar para encontrar cualquier cosa que coincida con un determinado patrón. Por ejemplo, puede encontrar todas las páginas dentro de un subdirectorio o todas las páginas con una cadena de consulta de más de diez caracteres.
Las expresiones regulares proporcionan una forma potente y flexible de describir el aspecto del patrón, utilizando una combinación de letras, números y caracteres especiales.
Por ejemplo, si escribe html
en el cuadro de búsqueda de los informes de contenido, obtendrá todas las URL que contengan «html» en cualquier lugar de la ruta. Por ejemplo, se devolverían las siguientes páginas:
- /index.html
- /html-definitions.php
- /search.php?q=html+vs+php
El carácter de escape: Barra invertida
Las expresiones regulares utilizan una serie de caracteres especiales que conllevan significados específicos. Esta es una lista exhaustiva, pero no completa, de los caracteres especiales en regex que llevan un significado no literal.
^ $ . ? () + \
Como ejemplo, el signo de interrogación significa «hacer el carácter anterior opcional» en regex. Mostraremos un ejemplo de esto en acción más adelante en este artículo.
Pero si quieres buscar un signo de interrogación, necesitas «escapar» de la interpretación regex del signo de interrogación. Esto se logra colocando una barra invertida justo antes del signo de interrogación, de la siguiente manera:
\?
Si desea buscar el carácter de punto, escápelo agregando una barra invertida antes de él. Por ejemplo, \.html
coincidiría con un punto seguido de la cadena «html».
Si desea coincidir con una serie de caracteres especiales en una fila, simplemente escape cada uno de ellos individualmente. Para que coincida con «$?», escribiría $\?
.
Puede escapar cualquier carácter especial con una barra invertida – ¡incluso la barra invertida!
Si no está seguro de si un carácter es especial o no, puede escaparlo sin consecuencias negativas.
Anclas: Caret y Dollar
Las expresiones regulares coinciden con el patrón que usted especifica si aparecen en cualquier parte de la cadena: al principio, en medio o al final. Hay anclas que puedes utilizar en regex para especificar que un patrón sólo debe aparecer al principio o al final. Los caracteres de anclaje son:
^ $
Utilice el símbolo de intercalación (^) para anclar un patrón al principio. Utilice el símbolo del dólar ($) para anclar un patrón al final. Puede utilizar cualquiera de los dos en un
^/page
que coincida con «/pages.html», «/page/site.php» y «/page». No coincidirá con «/página/sitio» o «/pág/es.html».
^car$
sólo coincidirá con «car» y ^$
sólo coincidirá con cadenas vacías.
$/google.php^
no coincidirá con nada porque es un regex incorrecto: el signo de intercalación debe estar siempre a la izquierda del dólar: ^/google.php$
Rangos de caracteres
La regex también puede utilizarse para coincidir con rangos o combinaciones de caracteres. Los corchetes le permiten especificar una variedad de caracteres que pueden aparecer en una determinada posición de la cadena.
Por ejemplo, coincidiría con la «e», la «i» o la «o».
Puede incluir una larga lista de caracteres entre corchetes, pero es más fácil coincidir con un rango de caracteres con un guión. Por ejemplo:
Coincidirá con cualquier letra minúscula de la a a la z. (Google Analytics no distingue entre mayúsculas y minúsculas por defecto.)
Coincidirá con cualquier letra minúscula, mayúscula o número.
Coincidirá con a, b, c, d, X, Y o Z.
Los corchetes miran cada carácter individual, no palabras enteras.
coincide con una sola ocurrencia de «w», «o», «r» o «d».
Para coincidir con una cadena de caracteres, enciérrelos entre paréntesis y utilice una tubería (|) como carácter «o». Por ejemplo, para que coincida con una instancia de «gato» o «perro», escribiría:
(cat)|(dog) OR (cat|dog)
.
Por último, utilice un punto para que coincida con cualquier carácter. Es como un comodín para un solo carácter:
car.s
coincidirá con «carrs», «car?s», «car5s», etc.
Patrones de repetición
Con regex, incluso puede especificar el número de veces que debe aparecer un patrón.
Un signo de interrogación después de un carácter coincidirá con cero o una ocurrencia del carácter. Esto hace que el carácter sea opcional:
aa?pple
Coincidirá con «aapple» o «apple».
Un signo más coincide con una o más ocurrencias.
a+
Coincidirá con «a», «aa», «aaaaaaaaaa», etc.
Un asterisco coincide con cero o más del carácter anterior. Combinado con un punto, «.*» se utiliza comúnmente como comodín porque coincide con cualquier cosa.
.*
Coincidirá con cualquier cadena no vacía.
Los corchetes le permiten coincidir con un rango específico de ocurrencias. Usted especifica el número mínimo y máximo de ocurrencias.
ca{3,5}t
Coincidirá con «caaat», «caaaat», «caaaaat», pero no con «cat» o «caaaaaaaaat».
Siguientes pasos
Utilice nuestro comprobador de expresiones regulares gratuito para probar sus propias expresiones regulares. Siéntase libre de marcar la página también.