Reguliere expressies (regex)

Analytics ondersteunt reguliere expressies. Dit betekent dat u flexibelere definities kunt maken voor zaken zoals weergavefilters, doelen, segmenten, doelgroepen, inhoudsgroepen en kanaalgroepen.

In de context van Analytics zijn reguliere expressies specifieke tekenreeksen die overeenkomen met brede of selectieve patronen in uw Analytics-gegevens.

Stel bijvoorbeeld dat u een weergavefilter wilt maken waarmee u door uw eigen medewerkers gegenereerde sitegegevens uitsluit. U kunt dan een reguliere expressie gebruiken om gegevens uit te sluiten van de volledige reeks IP-adressen die door uw medewerkers wordt gebruikt. Laten we zeggen dat deze IP-adressen het volgende bereik hebben: 198.51.100.1 - 198.51.100.25. In plaats van 25 verschillende IP-adressen op te geven, kunt u de volgende reguliere expressie maken: 198\.51\.100\.\d*. Deze komt overeen met het volledige bereik van adressen.

Als u een weergavefilter wilt gebruiken met alleen campagnegegevens van twee verschillende steden, kunt u een reguliere expressie maken als San Francisco|New York (San Francisco of New York).

Metatekens voor reguliere expressies

Jokertekens

. Komt overeen met elk willekeurig teken (letter, cijfer of symbool) 1. komt overeen met
10, 1A

1.1 komt overeen met
111, 1A1

Voorbeelden
? geeft aan dat het voorgaande teken nul of één keer mag voorkomen 10? komt overeen met
1, 10

Voorbeelden
+ geeft aan dat het voorgaande teken één of meer keer mag voorkomen 10+ komt overeen met
10, 100

Voorbeelden
* geeft aan dat het voorgaande teken nul of meer keer mag voorkomen 1* komt overeen met
1, 10

Voorbeelden
| maakt een OF-overeenkomst

Niet gebruiken aan het einde van een expressie
1|10 komt overeen met
1, 10

Voorbeelden

Ankers

^ geeft de naastliggende tekens aan het begin van een tekenreeks aan ^10 komt overeen met
10, 100, 10x

^10 komt niet overeen met
110, 110x

Voorbeelden
$ geeft de naastliggende tekens aan het eind van een tekenreeks aan 10$ komt overeen met
110, 1010

10$ komt niet overeen met
100, 10x

Voorbeelden

Groepen

( ) komt overeen met de tekens tussen de haakjes in exacte volgorde op een willekeurige plaats in een tekenreeks


Wordt ook gebruikt om andere expressies te groeperen
(10) komt overeen met
10, 101, 1011

([0-9]|[a-z]) komt overeen met
elk cijfer of elke kleine letter

Voorbeelden
[ ] komt overeen met de tekens tussen de haakjes in elke volgorde op een willekeurige plaats in een tekenreeks [10] komt overeen met
012, 123, 202, 120, 210

Voorbeelden
- maakt een reeks tekens tussen haken die wordt gevonden op een willekeurige plaats in een tekenreeks [0-9] komt overeen met elk cijfer van 0 tot en met 9

Voorbeelden

Escape

\ geeft aan dat het volgende naastliggende teken letterlijk moet worden geïnterpreteerd en niet als een metateken voor reguliere expressies \. geeft aan dat de naastliggende punt moet worden geïnterpreteerd als een punt of decimaal in plaats van als een jokerteken.

216\.239\.32\.34 komt overeen met
216.239.32.34

Voorbeelden

 

Tips

Houd uw reguliere expressies eenvoudig. Eenvoudige reguliere expressies zijn voor andere gebruikers gemakkelijker te interpreteren en aan te passen.

Gebruik de backslash (\) om metatekens voor reguliere expressies uit te schakelen als u wilt dat deze tekens letterlijk worden geïnterpreteerd. Als u bijvoorbeeld een punt gebruikt als het decimale scheidingsteken in een IP-adres, schakelt u die uit met backslash (\.) om te voorkomen dat de punt wordt geïnterpreteerd als een jokerteken.

Reguliere expressies hoeven geen metatekens voor reguliere expressies te bevatten. U kunt bijvoorbeeld een segment maken voor alle gegevens uit India door de volgende filterdefinitie toe te passen: Land komt overeen met regex India.

Reguliere expressies zijn veelomvattend: als u het ze niet verbiedt, komen ze overeen met wat u opgeeft, plus eventuele naastliggende tekens. Site komt bijvoorbeeld overeen met mijnsite, uwsite, hunsite en website; elke tekenreeks die 'site' bevat. Als u een specifieke overeenkomst nodig heeft, stelt u uw regex overeenkomstig op. Als u bijvoorbeeld alleen de tekenreeks 'site' wilt vinden, stelt u de regex zo op dat 'site' zowel het begin als het eind van de tekenreeks is: ^site$.

Was dit nuttig?
Hoe kunnen we dit verbeteren?