Der Popkulturjunkie hat entdeckt, dass man sich mit Hilfe des GoogleReaders die Anzahl der Feed-Abonnenten anzeigen lassen kann, was ihn dazu animiert hat, auf Grundlage dieser Daten eine weitere Rangliste der Topblogs zu erstellen. Die eigentlich spannende Frage ist nun: Wie hängen die verschiedenen “Blogcharts” zusammen? Oder: hängen sie überhaupt zusammen? Um darauf eine Antwort zu finden, habe ich mir die drei Listen näher angesehen und mit R ein paar Werte berechnet:
Die Deutschen Blogcharts, die GoogleReader-Charts und die metaroll erfassen unterschiedliche PräferenzenZunächst fällt auf, dass der Überlappungsgrad der Listen nicht allzu groß ist. Anders ausgedrückt: nur 26 Weblogs finden sich sowohl auf den ersten 50 Plätzen der Deutschen Blogcharts und den Google Feedreader-Abozahlen wieder. Weitere 19 Blogs werden in den GoogleReader-Zahlen und der metaroll gelistet und 18 Blogs sind in den Deutschen Blogcharts und der Metaroll vertreten. Nur 15 Weblogs findet man auf allen drei Listen – ein Indiz dafür, dass sie tatsächlich etwas anderes erfassen (für die 15 gemeinsamen Blogs findet man allerdings eine mittlere (Rang-)Korrelation zwischen den Listen um 0.6, nur zwischen den Google-Charts und der metaroll liegt sie mit 0.4 deutlich darunter, ist allerdings nicht mehr signifikant). Zur Veranschaulichung hier ein kleiner Ausflug in die Mengenlehre:
Oben rechts finden sich also die “Link-Blogs”, also die Topblogs, was die Verlinkung über Trackbacks und Pings angeht, oben links die “Feed-Blogs”, die am häufigsten mit dem GoogleReader gelesen werden und unten die “Roll-Blogs”, die am häufigsten in den Blogrolls verlinkt werden. Unterscheiden sich diese drei Gruppen nur hinsichtlich der jeweiligen Operationalisierung von Wichtigkeit? Oder stecken dahinter auch inhaltliche Unterschiede? Möglicherweise liefert die Liste der Blogs, die nur in einer bestimmten Liste auftauchen, einen Hinweis darauf.
- Deutsche Blogcharts: Software Guide, Chilloutzone.de, bueltge.de, Der Spiegelfechter, WordPress Deutschland, dataloo, F!XMBR, Slanted, UPLOAD, Politcally Incorrect, Readers Edition, Die Fünf Filmfreunde, Politblog.net, blog.blogscout.de, Prinzzess’ Allerlei, 1x umrühren bitte, BloggingTom, Fefes Blog, turi2, blog.yoda.ch, Telagon Sichelputzer
- GoogleReadercharts: Web 2.0 Sammelalbum, Mac Essentials, GoogleWatchBlog, Inside AdSense, agenturblog.de, USA Erklärt, Fischmarkt, www.best-practice-business.de/blog, blog.tagesschau.de, VS-Geheim, S-O-S SEO Blog, Design Tagebuch, hostblogger.de, TVBlogger, Internetmarketing-News.de, taxi-blog.de, medienpiraten.tv, Photoshop-Weblog.de, Besserwerberblog, Webmaster Blog
- metaroll: Anke Gröner, argh!, Das hermetische Café, malorama, Weblog über Babykotze …, miagolare, Gesprächsfetzen, 500 Beine, ronsens, Mek Wito, Vorspeisenplatte, St. Burnster, [bov], ahoi polloi, Gepflegte Konversation fuer den Weltfrieden, franziskript.de, immer frei & immer fein raus, PR Blogger, Wortfeld, Lyssas Lounge, Medienrauschen, DAILY IVY, sofa. rites de passage, Textspeier, Bamblog, SCHOLZ, El quiosco de Señor Paulsen, fragmente
Schwierig. Ganz vorsichtig würde ich die Hypothese formulieren, dass in den GoogleReader-Charts technische Blogs stark vertreten sind, was vielleicht auch daran liegt, dass die Leserschaft dieser Blogs mit RSS-Feeds am besten vertraut ist. In den Deutschen Blogcharts findet man einige politische Blogs, die in den anderen Listen nicht auftauchen. Vielleicht ein Indiz dafür, dass vor allem kontroverse Themen häufiger verlinkt und kommentiert werden? Auf der metaroll schließlich überproportional viele lyrische und Notizbuchblogs, deren Wertschätzung man per Blogrollverlinkung ausdrückt, aber nicht unbedingt durch einen Trackback.
UPDATE: Bei Henning Krieg geht es weiter mit den wichtigsten Blawgs (= juristischen Blogs) in Deutschland und Blognation hat dasselbe für Technologieblogs unternommen.
Vier Gedanken dazu:
(1) Ganz sicher unterscheiden sich die drei Listen hinsichtlich der Operationalisierung von Wichtigkeit (mind. Wichtigkeit im Hinblick auf Lesen & Empfehlungen aussprechen).
(2) Venn-Diagramme lassen sich direkt mit R erstellen. Earl F. Glynn bietet eine schöne Einführung dazu.
(3) Interessant wäre doch auch zu erfahren, welche Rangplätze (im Mittel) der einen Liste in der jeweils anderen Liste nicht vertreten sind. Beispiel: Welcher mittlere Rangplatz lässt sich für die Einträge in den Deutschen Blogcharts bestimmen, die in der metaroll nicht vertreten sind usw. Ein Histogramm/Boxplot könnte über die Streuung Auskunft geben.
(4) Für die 15 gemeinsamen Einträge wäre doch nicht nur der (relative) Zusammenhang interessant, sondern auch ein Vergleich der absoluten Ränge. Eine gute Darstellungsmöglichgkeit wären drei Streudiagramme (GR-DB, GR-MR, DB-MR; noch besser in R via pairs, scatterplot.matrix (package car) etc. ).
Zu meiner Schande muß ich gestehen, dass ich heute erstmals von Metaroll gehört habe. Das mag daran liegen, daß wir keine klassische Blogroll führen.
Aber was solls: Auswertungen hie und da – hin und her. Wir haben Besucher – sogar Leser – und freuen uns drüber.