Spambots ausschließen – aber richtig!
Auf den Traffic, den Spambots auf Deiner Seite auslösen, wirkt sich der im ersten Schritt besprochene Hostname-Einschließen-Filter nicht aus. Der Grund dafür liegt darin, dass diese Bots deine Seite tatsächlich besuchen und folglich auf den Hostnames landen, die du tracken möchtest. Du benötigst daher einen zweiten Filter, der diese Spambots ausdrücklich ausschließt – mit allen bereits erwähnten Nachteilen. Denn damit der Filter volle Wirkung zeigt, musst du ihn ständig nachschärfen, indem du laufend die neuesten Spambots einträgst, die deine Website heimsuchen.
Gehe beim Anlegen des Filters wie folgt vor:
- Wie gehabt legst du auch diesen Filter in deiner neuen Ansicht an.
- Gehe dazu auf >Ansicht >Filter >Neuer Filter und gib dem Filter einen Namen, zum Beispiel „Spambots“.
- Wähle Benutzerdefiniert – Filtertyp: Ausschließen – Filterfeld: Kampagnenquelle und gib die Filterregel als Regex ein.
- Teste und speichere den neuen Filter.
Viele „Experten“ empfehlen an dieser Stelle, nach Verweisen zu filtern. Das funktioniert jedoch nicht, denn hierfür wäre nicht nur die Domain, sondern der komplette Verweis erforderlich.
Die besten Ergebnisse erhältst du, wenn du nach Kampagnenquelle filterst.
Hier noch einmal die Schritte, mit denen du die Filterregel erstellst:
- Identifiziere in deinen Berichten die Domains der Spambots, die deine Website tatsächlich besucht haben – z.B. indem Du im Bericht Verweiszugriffe als sekundäre Dimension Hostname wählst. Verdächtig sind Zugriffe mit validen Werten für Quelle und Hostname sowie 100% Absprungrate. Ggf. solltest du die Domains recherchieren. Keine so tolle Idee ist es, sie aufzurufen – du könntest dir einen bösen Schnupfen zuziehen.
- Sammle alle gefundenen Quellen (Domains) in deiner Textdatei
- Füge vor jedem Punkt einen Backslash ein
- Trenne die Domains durch senkrechte Striche
- Entferne alle Leerzeichen
- Ersetze alle Subdomains durch .* und entferne Mehrfacheinträge
Die Filterregel sieht dann in der einfachsten Form etwa folgendermaßen aus:
Bitte beachten:
- Filterregeln sind auf 255 Zeichen beschränkt – ggf. musst du weitere Filter anlegen
- Bitte keine Leerzeichen
- Bitte kein | am Anfang oder Ende der Filterregel
- Natürlich kannst du nach Herzenslust vereinfachen, wenn du dich mit Regex auskennst.
- Laut Google werden Subdomains automatisch mitgefiltert, die Regular Expression .* ist somit unnötig.
- Dasselbe gilt für das „Escapen“ der Punkte mittels Backslash.