Zahlen, Farben, Logs, Verwirrung


Ach wie cool. Da habe ich gerade was zur Statistik gebloggt und dann seh ich, dass ich hier noch einen Entwurf rumfliegen habe, der sich auch mit dem Thema befassen sollte. Na gut, dann nehme ich jetzt einfach mal alle Stichpunkte und schreibe meine Gedanken dazu auf:

  • Statistiken (Browser, Länder, Verweis auf Suchanfragen)
    Siehe Post von gestern.
  • Anzahl Posts und Kommentare
    Stimmt, das habe ich gar nicht erwähnt. Durchaus nicht völlig unproblematisch übrigens, denn in meinem Blogsystem gibt es Posts (Beiträge) und Entries (Einträge) - und von mir definiert noch Events. Die Beiträge fassen dabei alles zusammen, was als Inhalt veröffentlicht wurde, sprich mindestens einen Titel und ein Beschreibungsfeld (genutzt oder ungenutzt) hat. Darunter fallen auch statische Seiten und Blogroll-Links. Das System zählt von sich aus immer nur entweder alle Beiträge (also auch Links usw.) oder nur Einträge (also keine Events). Ich habe gebastelt und stellte fest: Ich habe die 500 bereits überschritten, es gibt (ohne diesen) 508 lesbare Artikel in diesem Blog. 317 Kommentare wurden abgegeben und 42 Entwürfe warten darauf, fertig gestellt zu werden (gleich nur noch 41).
  • Problematik JS (JavaScript) oder PHP loggen
    Mein Statistik-Tool bietet einen JavaScript-Code, um Besucher zu verfolgen, und eine PHP-Schnittstelle. Erstere machte das Laden der Seite spürbar langsamer, flog also raus; dadurch verlor ich leider die Möglichkeit Dinge wie die Bildschirmauflösung der Besucher zu loggen. Außerdem kriege ich seitdem weniger Informationen über Suchanfragen, die Besucher auf meinen Blog geführt haben - warum auch immer. Ich kann mir eigentlich nur vorstellen, dass JavaScript den gesamten Verlauf des Tabs abfagt und loggt, sobald eine Suchanfrage auftaucht, PHP kann das nicht. Das würde erklären, wieso ich manchmal nicht nachvollziehen konnte, wie eine Suchanfrage auf meine Seite geführt hat - der Besucher war möglicherweise vorher noch woanders.
  • Problematik Bots filtern
    Hm ja. Das ist der Hauptgrund, warum ich mir nicht einfach selbst ein Statistikdings schreibe: Mir fehlen die Kenntnisse, Bots zu erkennen, und ich würde dann auch loggen, wenn Google meine Seite indiziert. Selbst mein jetziges Tool scheint da nicht vollständig ausgereift zu sein, ich kann mir jedenfalls nicht vorstellen, dass täglich drei bis vier Leute meine Seite aus China aufrufen oder über einen chinesischen Proxy.
  • Problematik Feedzugriffe messen
    Ein weiteres ärgerliches Problem. Einige Leute lesen Konzertheld.de nur über ihren Feedreader - davon kriege ich nix mit. Ich habe zwar den Tracking-Code der Statistik auch in dem Modul untergebracht, das den Feed ausgibt, aber anscheinend funktionieren Feeds nicht so einfach wie ich dachte und ich habe nur sehr selten aufgezeichnete Besucher vom Feed, obwohl ich weiß, dass einige Leute den regelmäßig lesen. Außerdem hilft das nicht wirklich - wenn z.B. Google Reader den Feed abruft, um einen aktuellen Cache zu erstellen, würde das bei mir einen Besucher eintragen. Oder aber eben nicht, weil Google gefiltert wird, dafür würden dann aber auch alle Zugriffe der Leser, die Google Reader nutzen, nicht geloggt.

Statistiken sind eine schwierige Sache. Noch schwieriger wird das Ganze, wenn man versucht, Blogs anhand dieser Statistiken zu vergleichen. Vor allem die Qualität der Botfilter ist sehr unterschiedlich und ein gewisses Grundrauschen hat man immer drin. Eigentlich müsste man den Blog mal zwei Wochen leer laufen lassen, nirgendwo kommentieren und auch sonstige Verweise auf den Blog vermeiden und sehen, wieviele Besucher dann noch aufgezeichnet werden - das sind dann vermutlich zu 90% Bots, die ausgefiltert werden sollten. Das wird aber kaum jemand machen. Dennoch sind die durch Statistik erzeugten Zahlen nicht uninteressant - immerhin kann man dadurch Veränderungen sehen, z.B. wie sehr die Besucherzahlen durch erhöhte Postingfrequenz steigen, wieviel es bringt woanders zu kommentieren usw. - insofern eine interessante Sache, die aber sehr mit Vorsicht zu genießen ist.