Spaß mit Statistik

Mittwoch, 21. Dezember 2005, 15.32 Uhr | Giesbert Damaschke

Wer eine Website im betreibt und das nicht nur als reines Privatvergnügen für sich selber tut, der will natürlich auch wissen, wer sich auf seinen Seiten tummelt, wieviele Besucher ein Angebot hat, nach welchen Begriffen gesucht wird und ähnliches mehr.Daher bieten alle Webspace-Provider entsprechende Statistik-Pakete an, mit denen es (angeblich) möglich sein soll, die Besucherströme auf den Seiten minutiös zu analysieren. Dergleichen wäre, wenn es denn funktionierte, ein wichtiges Werkzeug bei der Strukturierung und dem Aufbau einer Webseite. Denn so wenig die Waren in einem Kaufhaus willkürlich angeordnet werden, so wenig sollte man es dem Zufall überlassen, welches Angebot ein Kunde zu sehen bekommt.

Stellt man zum Beispiel fest, dass eine wichtige Information auf den Webseiten so gut wie nie aufgerufen werden, kann man hier steuernd eingreifen und durch eine bessere Präsentation dafür sorgen, dass mehr Besucher die entsprechenden Seiten anklicken.

Soweit zumindest die Theorie, die Praxis ist hier, wie so oft, eher ernüchternd.

Nehmen wir als Beispiel einfach mal meine eigenen Webseiten (deren Statistiken ich preis geben darf, ohne Gefahr zu laufen, Betriebsgeheimnisse versehentlich auszuplaudern). Meine Site ist eine Mischung aus privater und kommerzieller Nutzung, hier finden sich eine Reihe von Dingen, die mich privat interessieren, aber auch als Portfolio eine Sammlung von Texten, die ich in den letzten Jahren für unterschiedliche Auftraggeber geschrieben habe.

Die Ernüchterung beginnt bereits bei so zentralen Daten wie den Zugriffszahlen. Im Januar 2005 hatte “damaschke.de” …

  • 2875 Besucher (“unique visitors”),
  • die 8873 Seiten abgerufen (“page views”) ,
  • 28565 Serverzugriffe (“hits”) erzeugt und
  • einen Datenverkehr von 245,11 MB ausgelöst haben (“traffic”).

Das ist ein eher mageres Ergebnis (im Jahr zuvor waren die Werte fast doppelt so hoch), aber im Laufe des Jahres haben sie sich deutlich verbessert. Im November 2005 stiegen die Zahlen auf

  • 10279 visitors,
  • 15605 page views,
  • 90353 hits und
  • 649,96 MB traffic.

Doch der schöne Schein täuscht – diese Zugriffszahlen, die mir meine Statistik-Software hübsch grafisch aufbereitet präsentiert, sind ohne aufwändige Analyse praktisch wertlos.

Denn die gestiegenen Zugriffszahlen verdanken sich nicht einer besseren Strukturierung der Site, sondern der simplen Tatsache, dass ich seit einigen Monaten bestimmte Informationen auf damaschke.de über einen RSS-Feed zur Verfügung stelle.

Die nach oben geschnellten Zugriffszahlen repräsentieren also nicht, wie man meinen könnte, reale Menschen, sondern zu rund 50 Prozent handelt es sich hier um automatische Abfragen von RSS-Readern, bei denen es völlig unsicher ist, ob die gesammelten Daten von irgendeinem Menschen gesehen werden oder ungelesen im digitalen Orkus verschwinden.

Ein RSS-Reader sorgt auch dann für visits und page views, wenn es keine Besucher gibt, die Seiten betrachten. Es ist durchaus möglich und sogar sehr wahrscheinlich, dass der bei weitem größte Teil an Informationen, die ein RSS-Reader automatisch einsammelt, niemals von irgendjemanden zur Kenntnis genommen wird.

Neben RSS-Readern sind die verschiedenen Spider und Robots der Suchmaschinen die häufigsten Besucher meiner Site. Von den rund 90000 Hits im November gehen zum Beispiel knapp 8000 allein auf das Konto des Google-Bots.

Da es sich bei einem großen Teil der scheinbaren Besucher gar nicht um Besucher, sondern um Programme handelt, dann überrascht es auch nicht, dass gut 85 Prozent alle Besucher nicht länger als 30 Sekunden bei damaschke.de bleiben.

30 Sekunden genügen nicht nur einem Bot, sondern sind auch lang genug, um einem menschlichen Besucher zu zeigen, dass er auf damaschke.de nicht das findet, was er gesucht hat.

Die Rangliste der “Keywords” wird angeführt von: “Mein Kampf”, “Porno” und “Beziehungsprobleme”. Bei “Mein Kampf” wird man bei mir tatsächlich fündig (es findet sich eine Darstellung zur rechtlichen Situation), aber die beiden anderen Begriffe tauchen in gänzlich anderen Kontexten auf, als die Suchenden wohl gehofft haben.

Kurz: Die beeindruckende Zahl an Zugriffen und Besuchern zerbröselt bei genauerem Hinsehen zu einem kleinen Häufchen. Auch hier gilt wohl die “90/10″-Faustregel: Nur 10 Prozent aller Zugriffe stammt von Besuchern, die tatsächlich an den Inhalten von damaschke.de interessiert sind, der Rest sind Spider, Bots & Irrläufer.

Hier müsste eine Statistik-Software, die ihren Namen verdient, überhaupt erst ansetzen. Denn nun ginge es zum Beispiel darum, herauszubekommen, woher die Besucher kommen, mit welchem Provider sie unterwegs sind, über welche Wege die Besucher damaschke.de betreten, welche Seiten sie in welcher Reihenfolge abgerufen und welche Informationen sie gelesen haben.

Allein – da ist meine Statistik bereits an ihre Grenzen gekommen. Sie kann mir hier zwar einige der gewünschten Informationen bieten, aber nicht alle, die mich interessieren würden.

Auch bei eine Webstatistik gilt also, dass man sie entweder nicht allzu ernst nehmen sollte – oder aber einen Spezialisten beauftragt, der eine auf die eigenen Wünsche und Bedürfnisse zugeschnittene Statistik-Lösung entwickelt.

Die Standard-Angebote der Webhoster, die nach dem Motto “One size fits all” ihre Statistik-Pakete anpreisen, taugen allenfalls zur Erheiterung, nicht aber zur ernsthaften Analyse.