Archive for the 'xfn' Category

Unterwegs ins Semantische Netz oder: Was sind XFN, FOAF und SPARQL?

sw-horz-w3c.pngVor wenigen Tagen zitterten Blogosphäre und Web2.0 vor Aufregung: Yahoo, so hieß es, würde große Nachrichten bekanntgeben, die das Netz zu einem besseren Ort machen würde. Also konnte es schon einmal nicht um die Übernahme durch AOL gehen. Tatsächlich gab Yahoo am Freitag bekannt, dass das Unternehmen sich von nun an als Evangelist des Semantic Web betrachten will.

Worum geht es im Semantic Web? Die grundlegende Idee ist schnell erzählt: Die Informationen, die wir auf unseren Homepages, in unseren Blogs und Social Networks hinterlegen, sollen maschinenlesbar werden. Die nur für Menschen entzifferbare Aussage “X ist ein Kollege von mir” soll nun zusätzlich mit Hilfe von Mikroformaten wie XFN (kurz für “XHTML Friends Network”) oder FOAF (Akronym für “Friend of a Friend”) derart ausgezeichnet werden, dass ein entsprechender Parser sie verstehen kann. Das kann dann zum Beispiel so aussehen (“friend met” verweist hier auf eine befreundete Person, die der Verlinkende schon im wirklichen Leben getroffen hat):


<a href="http://www.wissenswerkstatt.net/" rel="friend met">Marcs Wissenswerkstatt</a>

Davon erhofft man sich einen besseren Zugriff auf die im Web 2.0 gespeicherten Informationen. So könnte man zum Beispiel mit Personensuchmaschinen auf diese Weise nicht nur erfahren, auf welchen Internetseiten der Name einer Person auftaucht, sondern zudem auch Dinge wie: die eigene Homepage der Person, die Seiten seiner Freunde und Arbeitskollegen, seine Profile bei Facebook, Twitter, Xing usw. Es geht also um die Übertragung der realen Beziehungsnetzwerke (“everyone’s connected”) in die digitale Sphäre (“social graph”). Das Internet wird dadurch sehr viel enger und aussagekräftiger verlinkt als bisher:

Linked Data is about using the Web to connect related data that wasn’t previously linked, or using the Web to lower the barriers to linking data currently linked using other methods.

So praktisch das sein mag, wenn es darum geht, seine Freunde und Bekannte im Netz ausfindig zu machen – ganz abgesehen davon, dass ein derart ausgezeichnetes Netz die wildesten Träume vieler Netzwerkanalytiker übertreffen würde –, so problematisch ist diese Entwicklung, was die Missbrauchmöglichkeiten betrifft.

Was geschieht, wenn meine Seite (und damit meine virtuelle Identität) mit einer Person aus organisiert-kriminellem oder terroristischem Umfeld per Mikroformat verknüpft werden? Die Stärke eines dezentralen Systems (es gibt keinen “Datenbankadministrator, der Gott spielen kann”) werden hier zur Schwäche. Denn: Wer garantiert, dass die Verbindungen zu meiner Person, die auf anderen Webseiten formuliert werden, auch tatsächlich zutreffen? Denn die meisten dieser Formate sind, anders als LinkedIn-, Xing- oder Facebook-Freundschaften, nicht nur dezentral, sondern auch unidirektional, d.h. sie müssen nicht bestätigt werden.

Verschärft wird dieses Problem noch durch die Permanenz des Internet: wenn einmal an einer Stelle eine Beziehungsaussage über mich getroffen wurde, kann diese möglicherweise nicht mehr gelöscht werden, da sie über Archive aufgefunden werden kann (so scheint das Google Social Graph API, kurz: SGAPI, Beziehungsdaten zu cachen) oder bereits in zahlreiche FOAF-Datensätze auf anderen Seiten integriert wurde. Denn eine sinnvolle Möglichkeit, Beziehungsclaims zu zitieren (“Ich sage, dass Markus gesagt hat, Anne ist mit Peter befreundet”) gibt es meines Wissens noch nicht.

Das hat zur Folge, darauf hat danbri in seinem VortragSocial Network Portability” am 1. März in Cork hingewiesen, dass derartige Aussagen nicht als Tatsachenaussagen betrachtet werden dürfen, sondern nur als Behauptungen (“Claims”). Ein Semantic Web-Parser muss also in Betracht ziehen, welche Person hinter einer FOAF-Aussage steckt.

Einen möglichen Ausweg stellen Systeme wie SPARQL (kurz für “SPARQL Protocol and RDF Query Language”) da, die nicht nur die Aussagen aus dem semantischen Netz ziehen, sondern sich darüber hinaus auch dafür interessieren, an welcher Stelle und von welchem Akteur die Aussagen gemacht wurden. Hier geht es also nicht nur um die Frage: “Wer ist mit Peter befreundet?” sondern um “Wer sagt, dass Anne mit Peter befreundet ist?”

Momentan laufen erste Versuche, WordPress SPARQL-freundlich zu machen (“SparqlPress”). Damit werden zwei Ziele verfolgt: zum einen über einzelne Blogs Daten bereitzustellen, die mit SPARQL abgerufen werden können. Dadurch kann dann zum anderen das eigene Blog in eine automatisch aktualisierte Kontaktdatenbank verwandelt werden. Auf Grundlage der eigenen Kontaktliste können dann Aktivitätsströme erstellt werden, ähnlich zu den Facebook- und Xing-Statusmeldungen oder zu neuen Lifestream-Diensten wie Friendfeed. Mit dem FOAFnaut gibt es auch schon ein graphisches Interface, um das eigene FOAF-Kontaktnetzwerk zu visualisieren.

Wahrscheinlich lassen sich die Veränderungen, die sich durch die allmähliche Etablierung des Semantischen Netzes für das digitale Identitäts- und Beziehungsmanagement ergeben werden, überhaupt noch nicht in ihrer ganzen Tragweite erkennen. Zwei Punkte scheinen mir jedoch absehbar:

  • Klar ist, dass die in diesem Ausmaß noch nie da gewesene Archivierung und öffentliche Zugänglichkeit von Beziehungsdaten das digitale Identitäts- und Beziehungsmanagement zu einer sehr viel komplexeren Aufgabe machen wird. Das Prinzip “security through obscurity” wird es für diesen Bereich nur noch rudimentär geben: meine sozialen Beziehungen sind nicht mehr Teil der Privatsphäre, sondern öffentlich einsehbar.
  • Das professionelle Reputationsmanagement wird ein sehr wichtiges Geschäftsfeld werden, da für den Normalbürger die Kanäle gar nicht mehr absehbar sind, über die Informationen über die eigene Person verbreitet werden. Früher konnte man sich schon denken, wer ein Gerücht in die Welt gesetzt hat, heute sind es anonyme Maschinen, die Informationen aus unterschiedlichen Quellen kombinieren und als Ergebnis dann z.B. ein mit Ortskoordinaten versehenes Bild der eigenen Familie ausspucken.
  • Zugleich wird sich dadurch auch das Wesen der Suchmaschinen verändern, die nicht mehr allein zum Abrufen von Textinhalten genutzt werden können, sondern auch zum Abfragen von Beziehungsdaten.

Frei nach Kisch könnte man also schlussfolgern: Mit den Möglichkeiten des Semantischen Netz wird das Leben schöner, aber unsicherer.



Verwandte Artikel:
  • Netzwerkvisualisierung mit TwitterFriends
  • Netz, Web und Graph: Idealismus reloaded
  • Die Zukunft des WWW (Richard MacManus)
  • Mikroformate

    Wer sich in Web2.0-Kreisen bewegt, ist sicher schon einmal auf den Begriff “microformat” gestoßen. Was verbirgt sich dahinter? Im wesentlichen geht es hier um einfache, offene Datenformate, die sowohl maschinen- als auch menschenlesbar sein wollen. Ein Beispiel dafür dürfte den WordPress-Benutzern allgegenwärtig sein (Klick zum Vergrößern):

    xfn.png

    Wenn man seiner Blogroll einen neuen Link hinzufügt, kann man dort angeben, in welcher Beziehung man zu dem Link steht: Handelt es sich um eine andere eigene Webadresse? Oder um einen Freund, Kontakt, Bekannten, den man bereits oder auch nicht “physisch” getroffen hat? Oder ist es ein Arbeitskollege, ein Nachbar, gar ein Familienmitglied? Oder gehört die Beziehung in das Reich der romantischen Liebe? Das Format, in dem diese “link relationship” dann gebracht wird, heißt XFN (XHTML Friends Network) und ist – richtig geraten – ein Mikroformat, das entwickelt wurde, um soziale Beziehungen zu klassifizieren. So könnte zum Beispiel der Link in einer Blogroll dann so aussehen:

    <a href="http://www.eigenarbeit.org/blog" rel="friend met">

    Das heißt nichts anderes als, dass der Poster dieses Links mit mir befreundet ist und wir uns auch schon außerhalb der virtuellen Realität begegnet sind. Neben dem erwähnten XFN gibt es aber noch zahlreiche andere Formate zur Beschreibung von Personen, Organisationen, Ereignissen, Meinungen, Rezensionen, Lizenzen, Kategorien, Tags oder Listen. Auch die Verbannung von Webcrawlern funktioniert per Mikroformat. Letztlich zielen diese Formate alle darauf, das Web zu semantifizieren, so dass letztlich die Berners-Lee’sche Vision Wirklichkeit wird, in der Computer sich mit anderen Computern austauschen können und sich zum Beispiel selbstständig im Netz umsehen nach Freunden des Benutzers, die in der Nähe wohnen und zu einem Videoabend eingeladen werden können. Aber der Anspruch der Mikroformate richtet sich auch auf die Menschenlesbarkeit. Nur: wer will denn im HTML-Quellcode herumwühlen, um herauszufinden, wie der Blogroll Link zum eigenen Blog auf einer anderen Seite klassifiziert wird.

    <a href="http://www.eigenarbeit.org/blog" rel="spammer idiot">

    (An alle mitlesenden Juristen: Wäre so etwas eigentlich eine abmahnungsfähige Beleidigung?) Außerdem können diese Mikroinformationen ja auch per JavaScript dynamisch in die Seite eingefügt werden, dann gibt’s im Quellcode erst mal gar nichts zu lesen. Abhilfe schafft ein Firefox-Plugin namens “Operator”, das jede geladene Seite nach Mikroformaten durchscannt und diese dann höchst menschenlesbar darstellt.

    Wenn ich mich zum Beispiel mit eingeschaltetem Operator auf Twitter oder last.fm bewege, dann sehe ich sofort, dass hier Informationen über meine Freunde/Kontakte auch im hCard-Mikroformat abrufbar sind.

    twitter.PNG

    Diese Informationen kann ich dann zum Beispiel direkt als Visitenkarte im vCard-Format abspeichern oder meinem Windowsadressbuch hinzufügen. Oder ich lasse mir diese Informationen gleich in meine Yahoo-Kontaktliste einspeisen. Wenn sich auf einer Seite Tags befinden, dann kann ich mir zu diesen Tags Bilder auf flickr anzeigen lassen, passende Bookmarks auf del.icio.us oder Blogs beziehungsweise Einträge auf technorati. Wenn etwas als Ort kodiert ist, kann ich gleich GoogleMaps starten lassen und den Ort suchen. Aber es kommt noch praktischer: Surfe ich auf last.fm, dann kann ich Konzerttermine, die dort angegeben sind, ganz leicht in meinen Google- oder Yahoo-Kalender importieren. Und das alles nur mit ein bis zwei Mausklicks. Und wenn mir die vorhandenen Mikroformate oder Skripte nicht reichen, kann ich eigene programmieren.



    Verwandte Artikel:
  • Die Zukunft des WWW (Richard MacManus)
  • Die walled gardens öffnen sich ein Stückchen: Google, Facebook und Plaxo engagieren sich für Datenportabilität