Ansatz #1 – User Agent
Am einfachsten ist es, Klicks von Bots zu blockieren, die sich als solche zu erkennen geben. Einige Bots durchstreifen das Web mit dem Ziel, Informationen zu sammeln. Diese Bots lassen andere bewusst wissen, dass sie Bots sind. Dazu nutzen sie die Variable „User Agent“: Damit teilt ein Web-Browser einer Website Informationen über sich mit. Üblich ist es dabei, dass der User Agent eines Bots den Begriff „Bot“ enthält; andere sinnvolle Begriffe sind zum Beispiel „Crawler“ oder „Spider“.
Ansatz #2 – Click-Through-Rate
Einer der effektivsten Ansätze zur Erkennung von Bots-Klicks nutzt die Click-Through-Rate. Menschliche User klicken in der Regel auf weniger als 5 % der ihnen präsentierten Ads. Wenn also von einer bestimmten IP-Adresse ein deutlich höherer Prozentsatz der Ads angeklickt wird, ist das ein klares Anzeichen dafür, dass diese IP von Bots kompromittiert wurde. Es kann jedoch vorkommen, dass menschliche User eine Seite mit mehreren Ads öffnen, eine Anzeige anklicken und direkt danach den Browser schließen. Deshalb sollte man zunächst einen unteren Grenzwert für die Anzahl der Klicks in einem bestimmten Zeitraum ermitteln, bevor man die Click-Through-Rate zur Bot-Jagd nutzt.
Ansatz #3 – Häufigkeit
Eine andere, häufig benutzte Methode, um Bots zu identifizieren, ist die Anzahl bestimmter Aktionen (zum Beispiel Klicks) in einem gewissen Zeitraum. Das ist besonders dann hilfreich, wenn Bots zwar menschliche Click-Through-Rates imitieren, dabei jedoch auf Volumen setzen. Menschliche User klicken in der Regel auf weniger als zehn Anzeigen pro Minute. Wenn man also feststellt, dass ein bestimmtes Cookie viele Male pro Minute klickt, dann ist das ein klares Anzeichen dafür, dass der Rechner mit diesem Cookie von einem Bot übernommen wurde. Man soll jedoch stets im Hinterkopf behalten, dass sich hinter IP-Adressen eine Vielzahl von Endgeräten verbergen können. Entsprechend sollte man nur äußerst konservativ vorgehen, wenn man die Häufigkeit und Frequenz über die IP bestimmen will.
Im dritten Teil unserer Serie sprechen wir darüber, wie und warum nur die Hälfte aller Ads jemals von menschlichen Augen gesehen werden.