Archive for the 'sna' Category

Networking auf dem DLD

Nebenan bei im hübschen Datenblog habe ich mir einmal die Twitter-Diskussionen zur diesjährigen DLD-Konferenz vom Kongressvorabend bis zum heutigen Montag angesehen. Man sieht sehr schön, wie sich die Aufmerksamkeit von Tag zu Tag im Netzwerk verschiebt. Ich bin gespannt, wie sich das zum letzten Tag noch einmal ändert. Außerdem werde ich abschließend auch noch einmal die Twitternachrichten selbst betrachten, um Muster herauszufinden. Das zum Beispiel war der Montag:

Hier geht’s zum Artikel.



Verwandte Artikel:
  • Typen digitaler sozialer Netzwerke (Robert Peck)
  • Let’s Mash (Yahoo!)
  • Fugly is the new beautiful (Yahoo! Mash)
  • Der Appstore als Netzwerk – Newsreader, Newsportale und digitale Zeitungen

    Why then the world’s mine network
    Which I with software will open.

    Der Vorteil einer abstrakten Methode wie der Social Network Analysis ist es, dass sich fast alle Daten, die irgendwie zusammenhängen, als Netzwerk betrachten und analysieren lassen. Das Paradebeispiel sind natürlich die Empfehlungsalgorithmen, die Nutzern von Google, Youtube oder Amazon erzählen, was sie sonst noch interessieren könnte. Überall dort, wo es empfohlene Produkte oder Produkte, die andere Kunden auch gekauft haben, gibt, kann man sehr einfach mit den Methoden der Netzwerkanalyse angreifen. Auf diese Weise wird aus den isolierten Paaren oder Mengen verwandter Produkte eine große Verwandtschaftskarte, auf der nicht nur Beziehungen, sondern auch Muster und Schwerpunkte erkennbar sind.

    Ich habe mir einmal den iTunes-Appstore vorgenommen. Auf jeder (bzw. fast jeder) Downloadseite einer App sind weitere fünf Apps verzeichnet, die überdurchschnittlich häufig gemeinsam mit dieser App heruntergeladen oder gekauft werden. Das Netzwerk springt einem hier förmlich entgegen. Wenn man die 240 beliebtesten Apps der Kategorie Nachrichten auf diese Beziehungen hin erfasst, erhält man folgendes Netzwerk der Nachrichten-Applandschaft (Klick zum Vergrößern):

    Social network visualization of app downloads

    Die Größe der Knoten steht für die Anzahl der Bewertungen der Apps – solange es keinen Zugriff auf die Downloadzahlen der Apps gibt, könnte das eine Annäherung an die Bedeutung oder Verbreitung einer App sein. Die Farbe zeigt die unterschiedlichen Cluster von Apps, die besonders eng miteinander verbunden sind: Links in Hellblau und rechts in Dunkelblau sind zwei Cluster von Nachrichtenapps. Rechts findet man die Zeitungsapps von FAZ, Bild, Süddeutsche, Abendzeitung, Weserkurier etc., während links eher die iPad-Varianten von Onlineportalen wie Spiegel, Focus Online, Süddeutsche.de zu finden sind. Oben in Violett ist ein kleines Cluster von redaktionsunabhängigen Newsaggregatoren wie Pulse, Flipboard oder Reeder. Ganz rechts liegt Österreich, während im Süden die Türkei zu finden ist. Dazwischen ein Applecluster mit Apfeltech und Macwelt. Ganz im Norden ist das Review-stärkste Cluster von Nachrichtenaggregatoren und App-Nachrichten-Apps, das von MeinProspekt dominiert wird.

    Die Apps mit den meisten Reviews in dieser Karte sind:

    1. Mein Prospekt XL – 39.382 Reviews
    2. n-tv iPhone edition – 16.140 Reviews
    3. DER SPIEGEL eReader – 12.759 Reviews
    4. FOCUS Online – 10.300 Reviews
    5. DIE WELT – 9.312 Reviews
    6. Flipboard – 6.394 Reviews
    7. BILD HD – 5.722 Reviews
    8. Tagesschau – 5.705 Reviews
    9. NYTimes – 5.533 Reviews
    10. AppTicker Push – 5.524 Reviews

    In dieser Aufzählung fehlt die normale Version von BILD mit 24.146 Reviews, die ein isolierter Knoten ist, da für diese App keine verwandten Apps angegeben sind und auch keine der anderen Apps auf sie verweist – eine echte Anomalie, die ich mir im Moment nicht erklären kann.

    Interessant ist auch der Blick auf die Anzahl der eingehenden Links, d.h. welche Apps besonders häufig als verwandte Apps genannt werden. Der Durchschnitt liegt bei 2,3.  Hier sieht die Liste ganz anders aus:

    1. The Wall Street Journal – 51 Nennungen
    2. AppAdvice – 45 Nennungen
    3. Blastr – 40 Nennungen
    4. NPR for iPad – 39 Nennungen
    5. Flo’s Weblog – 27 Nennungen
    6. eGazety Reader – 27 Nennungen
    7. ??-??? ????? a – 25 Nennungen
    8. SAPO News – 23 Nennungen
    9. DVICE – 20 Nennungen
    10. DER SPIEGEL – 18 Nennungen

    Dieselben Apps erhält man bei der Berechnung des PageRank, d.h. der Wahrscheinlichkeit, beim Abwandern des Netzwerks zufällig auf die verschiedenen Apps zu stoßen. Die Anzahl der Verbindungen zwischen den Apps, also der Vernetzungsgrad ist relativ niedrig, da für jede App nur jeweils 5 verwandte Produkte angezeigt werden – insgesamt sind die 451 Knoten durch 1.055 Kanten verbunden.



    Verwandte Artikel:
  • Kein Besucher bleibt ewig! Zeitungen sollen sich nicht neu erfinden, sondern das Verlinken lernen
  • Zeitungen springen auf den Web 2.0-Zug auf
  • Immer mehr Deutsche lesen Nachrichten im Netz – was macht der Rest im Internet?
  • Netzwerkvisualisierung mit TwitterFriends

    Gerade eben ist sie endlich fertig geworden, die Netzwerkvisualisierung für TwitterFriends. Dargestellt wird nicht das gesamte Kontaktnetz – also alle Followees und Followers -, denn das wäre zum einen unübersichtlich groß und zum anderen wenig aussagekräftig, da man Twitterkontakte sehr viel leichter hinzufügt als entfernt. Deshalb stellt TwitterFriends nur das “relevante Netzwerk” dar, also die Kontakte, denen eine Person in der letzten Zeit mindestens zweimal per ‘@’ geantwortet oder sich auf sie bezogen hat. Es geht also um das verborgene Netzwerk von Personen, denen eine Person auf Twitter öffentlich ihre Aufmerksamkeit schenkt. Nach Eingabe eines Twitter-Usernamen auf der Startseite von TwitterFriends erscheint das Ego-Netzwerk des Nutzers, hier für meinen Twitter-Account @furukama:

    TwitterFriends-Netzwerk für @furukama

    TwitterFriends-Netzwerk für @furukama

    Die Größe der Knoten des Netzwerkes entspricht jeweils der Anzahl von Tweets, mit denen ich mich an sie gerichtet habe. Dargestellt wird also die Intensität der Kommunikation zwischen dem zentralen Knoten (“Ego“) und den Kontakten im relevanten Netzwerk. Da diese Visualisierung bei vielen Kontakten schnell unübersichtlich wird, kann man durch dieses Netzwerk surfen: Per Klick auf einen Knoten, wird das Netzwerk um diesen zentriert, so dass man die Vernetzung der Kontakte untereinander analysieren kann:

    Blick auf die Vernetzung von @saschalobo im Netzwerk von @furukama

    Blick auf die Vernetzung von @saschalobo im Netzwerk von @furukama

    Unter der Netzwerkgrafik gibt es einen Link, mit dem man zwischen der obigen einfachen Netzwerkdarstellung und der vollen FOAF-Visualisierung (FOAF für “friend of a friend“) umschalten kann. Die zweite Darstellungsweise zeigt auch die Kontakte meiner Twitterkontakte, die sich nicht in meinem Netzwerk befinden, also auch meine “Freundesfreunde”. Hier erhöht sich die Zahl der Knoten noch einmal, aber auch hier kann man sich per Mausklick durch das Netzwerk bewegen:

    FOAF-Netzwerk von @furukama

    FOAF-Netzwerk von @furukama

    Die Netzwerkdarstellung benötigt keine zusätzliche installierte Software wie Java oder Flash. Verwendet wird die JavaScript-Visualisierungsbibliothek JIT von Nicolas Garcia Belmonte. Lauffähig müsste das Ganze auf Firefox, Chrome und Safari sein, mit eingeschränkter Geschwindigkeit auch im Internet-Explorer. Hier geht es zu der Anwendung.

    Hinweis: Bei einigen Twitternutzern erscheint das Netzwerk zunächst noch recht leer, das kann daran liegen, dass die Netzwerkdaten ihrer Kontakte noch nicht im Cache sind. In diesem Fall findet man unter der Netzwerkgrafik eine Liste von Links, mit denen man diese Daten einsammeln kann. Nutzer mit nicht-öffentlichem Profil oder ohne Replies können nicht erfasst werden. Das Ganze funktioniert ohne Eingabe des eigenen Twitterpassworts.

    Kommentare und Bugreports am besten per Twitter an @furukama oder gleich hier in die Kommentare. Danke!



    Verwandte Artikel:
  • TwitterFriends
  • Twitteranalyse for Dummies
  • Big Data und die Hackertugenden
  • Visualisierung von Netzwerken: GraphGear

    Schon seit längerem überlege ich immer mal wiede, wie sich die Netzwerkdaten der metaroll graphisch darstellen lassen. Am besten dynamisch generiert. Jetzt habe ich mit GraphGear schon einmal eine flashbasierte Lösung entdeckt, mit der das prinzipiell möglich ist. Die Anwendung ist sehr einfach. Mit diesem Code werden JavaScript und Flash eingebunden:

    <script type="text/javascript" src="swfobject.js"></script>
    <script type="text/javascript">
    // <![CDATA[
    var so = new SWFObject("GraphGear.swf", "graphgear", "725", "400", "8");
    so.addVariable("graphXMLFile", "graph_data.xml");
    so.write("gearspace");
    // ]]>
    </script>

    Dann muss man nur noch die Knoten und Kanten in eine xml-Datei schreiben:


    <?xml version="1.0"?>
    <graph title="Fruits and Vegetables" bgcolor="0xFFFFFF" linecolor="0xCCCCCC">
    <node id="n1" text="Fruits" color="0x7401DF" textcolor="0xFFFFFF"/>
    <node id="n2" text="Vegetables" color="0xFF8000" textcolor="0xFFFFFF"/>
    <edge sourceNode="n1" targetNode="n2" label="vs" textcolor="0x555555"/>
    </graph>

    Ich habe das metaroll-Script entsprechend angepasst, so dass es die zehn Blogs, die am stärksten mit einem bestimmten Blog verbunden sind, anzeigt (hier einmal für eleph.antville.org:

    graph.png

    Leider sind die Konfigurationsmöglichkeiten ziemlich eingeschränkt. Vor allem gibt es keine Möglichkeit, die Länge der Kanten einzustellen, was dazu führt, dass stark integrierte Netzwerke als kaum entzifferbarer Haufen dargestellt werden. Auch die Größe der Knoten lässt sich nicht verändern, so dass man keine Gewichtung darstellen kann und außerdem Probleme mit der Beschriftung bekommt. Außerdem ist das visualisierte Netzwerk etwas unruhig. Verschiebt man einen Punkt, dann oszillieren, schaukeln und sausen die Knoten über die Seite ohne aufzuhören. Dennoch: die leichte Einbindung und die freie Verfügbarkeit des Quellcodes unter der GNU GPL-Lizenz spricht dafür, dieses Werkzeug im Blick zu behalten.



    Verwandte Artikel:
  • Datenvisualisierung
  • Netzwerkanalyse von Hashtaglagern
  • Typen digitaler sozialer Netzwerke (Robert Peck)
  • Im Netz der Dinge – oder: wie ticken Apple-Nutzer?

    Die Methoden und Techniken der sozialen Netzwerkanalyse (SNA) lassen sich nicht nur zur Untersuchung von Personen und ihren Beziehungen einsetzen, sondern auch Gegenstände können damit analysiert werden: Willkommen im Netz der Dinge.

    Hier ein kleines Anwendungsbeispiel zu diesem Thema: Da ich selbst kein Apple-User bin, ist das für mich eine fremde Welt. Zum Glück kann man mit den amazon.de-Daten die Verbindungen zwischen unterschiedlichen Apple-Produkten abfragen und daraus dann einen netzwerkanalysefähigen Datensatz basteln. Im Folgenden habe ich den Apple iPod Touch 8GB als Ausgangspunkt genommen und das dazugehörige Ego-Netzwerk 2. Ordnung dargestellt (Klick zum Vergrößern):

    Das Netzwerk wurde mit netzwerkanalytischen Reduktionsverfahren etwas eingedampft, damit man etwas erkennen kann (wen die Details, Einsatzmöglichkeiten und Verbindungsmöglichkeiten mit anderen Methoden der Onlineforschung interessieren, kann mich gerne kontaktieren). Und tatsächlich, allmählich bekomme ich eine Ahnung davon, wie die Apple-Nutzer so ticken:

    • Sie sehen gerne mal eine DVD mit den neuesten Hollywoodfilmen wie etwa Pan’s Labyrinth, 300, Troja, Stirb Langsam 4.0, Transformers, Hannibal Rising oder Ghost Rising.
    • Aber natürlich sagen die Appler auch zu einem kurzen Playstation-3-Spielchen nicht nein. Motorsport und Piraten scheinen hier Topthemen zu sein.
    • Wer eine PS3 besitzt, nutzt diese vielleicht auch einmal zum Ansehen einer Blue-ray-Disk, etwa von Rocky Balboa oder eben 300.
    • Wie zu erwarten war, verwenden iPod-Nutzer auch auf ihrem Computer Apple-Software, so dass auch iLife 08 und das Betriebssystem OS X Leopard zu ihren Favoriten gehören.
    • Neben den iPod-Touch-Nutzern gibt es auch noch die iPod-nano-Nutzer, die ihr Gerät natürlich auch mit diversen Schutzfolien verkleben, aber hin und wieder auch etwas Sport treiben, wofür sie dann den iPod-Nike-Sport-Kit gekauft haben. Oder hat man einen iPod Touch fürs Büro und einen iPod nano für den Trimmdichpfad?
    • Nicht auf dem reduzierten Netzwerk, aber ebenfalls ein Betätigungsfeld für iPod-Nutzer: Bücher und Hörbücher von Terry Pratchett, Ratgeber zu Ruby on Rails, atheistische Literatur von Richard Dawkins, Philips Wohnleuchten und Sony P1i-Smartphones.

    So, genug der Analyse. Jetzt die Frage an euch, liebe iPod-Nutzer: Kommt das hin?



    Verwandte Artikel:
  • Der heilige Gral der Konsumkulturen
  • Woher kommen die Nutzer?
  • Münchener Medientage auf Twitter
  • Spickzettel Netzwerkanalyse (SNA)?

    Besteht Interesse an einem pdf-Spickzettel mit den wichtigsten Maßzahlen der sozialen Netzwerkanalyse (SNA) und ihren Interpretationsmöglichkeiten?



    Verwandte Artikel:
  • Netzwerkanalyse der metaroll
  • Netzwerkanalyse von Hashtaglagern
  • Der Aufstieg der Datenwissenschaftler
  • Patterns of mobilization in the blogosphere (English version)

    I just translated the slides with the network visualization of the Free Burma action for my international visitors into English:

    You can also download the slides as pdf. Comments welcome.



    Verwandte Artikel:
  • Karte der französischen Blogosphäre
  • Wissenschaftskultur und Blogkultur
  • Mobilisierungsmuster in der Blogosphäre II
  • Mobilisierungsmuster in der Blogosphäre II

    Wie Robert hier geschrieben hat, habe ich die Netzwerk-Grafiken zur Free Burma-Aktion aktualisiert und ein paar tentative Beobachtungen zusammengeschrieben. Wenn am Wochenende auf dem Barcamp MUC Interesse besteht, kann ich gerne auch etwas dazu erzählen:



    Verwandte Artikel:
  • Patterns of mobilization in the blogosphere (English version)
  • Hinweis: Stau in der metaroll
  • Wie politisch ist die Blogosphäre?
  • Netzwerkanalyse der metaroll

    Für alle diejenigen, die nach netzwerkanalytischen Maßen für die metaroll gefragt haben, hier sind ein paar Zahlen dazu (Stand 2.10. 22:00):

    Anzahl der analysierten Weblogs: 7736
    Dichte des Netzwerks: 0.0003
    Durchschnittliche Anzahl eingehender/ausgehender Links: 2,101
    Standardabweichung (eingehende/ausgehende Links): 4,174 / 11,060
    Median (eingehende/ausgehende Links): 1 / 0
    Netzwerkzentralisierung (eingehende/ausgehende Links): 0,01227 / 0,04266
    

    Die zehn zentralsten Webseiten, was die eingehenden Blogroll-Links angeht:

     1 2 3 4
     InDegree OutDegree NrmInDeg NrmOutDeg
     ------------ ------------ ------------ ------------
     48 Spreeblick 97.000 73.000 1.254 0.944
     1 Basic Thinking 85.000 47.000 1.099 0.608
     51 wirres.net 85.000 98.000 1.099 1.267
    270 BILDblog 78.000 0.000 1.008 0.000
    109 nerdcore 67.000 83.000 0.866 1.073
    156 Anke Groener 62.000 64.000 0.802 0.827
     49 Irgendwas ist ja imm 60.000 104.000 0.776 1.345
    119 Stefan Niggemeier 60.000 23.000 0.776 0.297
    127 Jojos illustrierter 59.000 41.000 0.763 0.530
    137 MC Winkels weBlog 59.000 78.000 0.763 1.008
    

    Die Eingangsgrade (Indegree) entsprechen definitionsgemäß der in der metaroll angegebenen rollcount, die als Sortierungskriterium für die Liste voreingestellt ist. Die Ausgangsgrade (Outdegrees) dem jeweiligen Umfang der Blogroll. Insofern überrascht es nicht, dass der Median der Ausgangsgrade bei 0 liegt, denn den 7736 erfassten Weblogs stehen momentan 565 erfasste Blogrolls gegenüber. Die Zentralisierung des Netzwerks ist vergleichsweise gering, wobei die Ausgangsgrade (also die Blogrolls) stärker zentralisiert sind als die Eingangsgrade (verlinkte Blogs). Zudem weist die für das Netzwerk ermittelte Dichte darauf hin, dass man es hier mit einem spärlichen Netzwerk zu tun hat.



    Verwandte Artikel:
  • Spickzettel Netzwerkanalyse (SNA)?
  • Netzwerkanalyse von Hashtaglagern
  • Der Aufstieg der Datenwissenschaftler