INS-ecommerce

Garbage-in Garbage-out: Die Business-Blog Bestenliste

Garbage in, Garbage out. So kann man die Business-Blog Top-100 zusammenfassen, die vor einigen Tagen veröffentlicht wurde. Warum? Wenn schon die Datenbasis (Alexa-Zahlen) Schrott ist, kann nicht viel mehr als Schrott herauskommen. Doch die meisten Blogger scheint das nicht zu stören. Bis auf eine Ausnahme scheint sich niemand für richtige Zahlen zu interessieren. Hauptsache man hat eine Top100, in der man Kaffeesatzlesen machen kann.

Einleitung
Ich behaupte nicht, jemand von den Machern der Top100 hätte absichtlich oder bewusst gelogen oder verfälscht. Die Liste ist bestimmt mit viel Liebe, Mühen, nach besten Wissen und Gewissen und mit guten Absichten erstellt worden. The road to hell is paved with good intentions.

GIGO (Garbage in, Garbage out)
Wenn man Statistiken erstellt, sollte man darauf achten, dass das verwendete Zahlenmaterial auch soviel Aussagekraft und Korrektheit besitzt, dass die hinterher getroffene Aussage sich daraus auch ableiten lässt. Ansonsten sollte man besser von Vermutungen und Spekulationen sprechen. Wenn nicht, belügt man sich selbst und Andere. Die TOP-100 behauptet, die "am meisten gelesenen deutschsprachigen Business-Blogs" aufzulisten. Mal abgesehen von der unklaren Definition, was ein Business-Blog überhaupt ist (gut, die fehlt auch bei Anderen), und der unvollständigen Recherche (diverse Blogs wurden "übersehen", das versucht man mit dem "Beta"-Label zu entschuldigen), basiert die Liste auf dem Alexa-Ranking, und disqualifiziert sich damit vollends in den Bereich Mythen&Legenden.

Wie funktioniert Alexa?
Über eine kleine Alexa-Toolbar (sensitive Naturen nennen es "Spyware") im Browser wird jede von diesem Browser/User besuchte Webseite an den Alexa-Server übermittelt. Auf der Webseite muss dazu nichts installiert werden, die Daten werden ohne Zutun des Webseitenbetreibers ermittelt.

Was misst Alexa?
Alexa misst daher nur die Seitenabrufe der User, die diese Alexa-Toolbar installiert haben. Abgesehen von technischen Fehlern ist diese Messung an sich recht genau. Doch die meisten Menschen interessiert nicht, welche Alexa-Toolbar-User auf ihrer Seite waren, sondern die Seitenabrufe aller Besucher. Also versucht Alexa aus ihrer (genauen) Datenbasis ("Besuche von Alexa-Usern") über eine Hochrechnung/Abschätzung zu "Besuche aller User" zu kommen. Genau da liegt der Kern des Problems. Denn Niemand (in Worten: "NIEMAND") kann diese Hochrechnung für alle Websites des Internet zuverlässig durchführen. Sie ist also immer mit einem nicht genau bestimmbaren (und variierendem) groben Fehler behaftet. Denn dafür müsste man wissen, wie sich das Verhalten der Alexa-User zu den Internet Gesamt-Usern verhält. Das kennt aber niemand global.

Hier mal einige gängige (d.h. oft geäusserte) Annahmen, die aber auch allesamt falsch sein können.
  • Alexa-User sind Technik-Affin (d.h. es sind technikverliebte Nerds, die immer die neueste Software installieren, aber sich nicht um Sicherheit kümmern)
  • Alexa-User kommen hauptsächlich aus den USA, da in Europa Alexa noch nicht so bekannt ist
  • Alexa-User sind eher unerfahren, da sie die in verschiedenen Browserpaketen defaultinstallierte Alexa-Toolbar nicht deinstallieren, da sie gar nicht wissen, was das ist
  • Alexa-User benutzen keine modernen Anti-Viren-Spyware Programme (weil die Alexa-Toolbar von diesen oft als Malware und Spyware erkannt und dann deaktiviert wird)

Alles nichts, um daraus eine Hochrechnung zu machen, oder?

Wie genau misst Alexa aber nun wirklich?
Wenn man die Alexa-Zahlen mit denen aus (richtigen) Webcontrolling-Systemen vergleicht, kann man locker auf Abweichungen bis Faktor 100 und mehr kommen. Nun gut, so könnte man Argumentieren, bei einem Top-100 Ranking interessieren nicht die absoluten Zahlen sondern nur die relativen Verhältnisse. Also sollte es passen. Passt aber nur, wenn der Alexa-"Messfehler" bei allen Websites einer Testgruppe gleich wäre. Aber selbst das ist er nicht. Also kann Alexa Websites, die tatsächlich mehr Besucher und Seitenabrufe haben schlechter Einstufen als solche mit weniger Besuchern/Abrufen. Also stimmt auch ein Ranking nicht, denn der Alexa-Messfehler scheint von Site zu Site verschieden zu sein. Aber wir sind noch nicht fertig. Der Alexa-Messfehler ändert sich nicht nur von Website zu Website sondern auch von Tag zu Tag. Also bekommt man bei bei einem Alexa-abhängigem Ranking auf- und ab Bewegungen, die gar nicht der Realität entsprechen. Noch nicht einmal verlässliche Trend-Aussagen sind möglich.

Es gibt verschiedene Stimmen, die z.B. sagen, die Zahlen von Websites die im Alexa-Ranking nicht unter den ersten 5-10 T liegen, haben so wenig Alexa-Besucher, dass die daraus errechneten statistischen Werte maximal den Status von "gut gewürfelt" haben können. Da Alexa die tatsächlichen Basiszahlen nicht offen legt, kann man auch darüber aber nur Spekulieren.

Das Fazit aus der Top100 Liste
Roberts Basic-Thinking scheint oft gelesen zu werden. Das hatte ich vorher irgendwie auch schon vermutet, auch wenn ich bisher nicht wusste, dass es ein Business-Blog ist. Alles andere ist aber Kaffeesatzlesen. Ansonsten scheint die positive Resonanz an dieser Top100 Liste, ungeachtet ihrer fragwürdigen Zahlen, den Wunsch nach Einteilung, Bestätigung und Rangfolge auszudrücken, der anscheinend stärker vorhanden ist, als ich dachte. Ach ja, und die Bestätigung der Erkenntnis, dass eine Statistik nicht "wahr" sein muss, um als ein gutes PR- und Marketinginstrument zu fungieren.

Nachsatz
Wer solch eine Liste in seiner Freizeit diskutiert und daran glaubt... bitte sehr. Ich will niemandem dieses Hobby vermiesen. Wer aber (und das vermute ich bei einer Business-Blog-Topliste fast ein wenig) auch nur ansatzweise aus den Rankings irgendwelche geschäftsrelevanten Schlussfolgerungen zieht, handelt (bestenfalls) naiv.


Geschrieben von af in Web Controlling am: Samstag, 3. März 2007
Permalink

Tags: , , , ,

Diesen Beitrag bei folgenden Diensten bookmarken:
del.icio.us - Digg it - Mister Wong - Technorati - Ruhr.com Suchmaschine

Kommentare

Nächster Artikel: Webcontrolling Grundlagen: Die Messmethoden

Vorheriger Artikel: Beispiele für die 80/20 Regel (Pareto-Prinzip)