Unterwegs ins Semantische Netz oder: Was sind XFN, FOAF und SPARQL?

sw-horz-w3c.pngVor wenigen Tagen zitterten Blogosphäre und Web2.0 vor Aufregung: Yahoo, so hieß es, würde große Nachrichten bekanntgeben, die das Netz zu einem besseren Ort machen würde. Also konnte es schon einmal nicht um die Übernahme durch AOL gehen. Tatsächlich gab Yahoo am Freitag bekannt, dass das Unternehmen sich von nun an als Evangelist des Semantic Web betrachten will.

Worum geht es im Semantic Web? Die grundlegende Idee ist schnell erzählt: Die Informationen, die wir auf unseren Homepages, in unseren Blogs und Social Networks hinterlegen, sollen maschinenlesbar werden. Die nur für Menschen entzifferbare Aussage “X ist ein Kollege von mir” soll nun zusätzlich mit Hilfe von Mikroformaten wie XFN (kurz für “XHTML Friends Network”) oder FOAF (Akronym für “Friend of a Friend”) derart ausgezeichnet werden, dass ein entsprechender Parser sie verstehen kann. Das kann dann zum Beispiel so aussehen (“friend met” verweist hier auf eine befreundete Person, die der Verlinkende schon im wirklichen Leben getroffen hat):


<a href="http://www.wissenswerkstatt.net/" rel="friend met">Marcs Wissenswerkstatt</a>

Davon erhofft man sich einen besseren Zugriff auf die im Web 2.0 gespeicherten Informationen. So könnte man zum Beispiel mit Personensuchmaschinen auf diese Weise nicht nur erfahren, auf welchen Internetseiten der Name einer Person auftaucht, sondern zudem auch Dinge wie: die eigene Homepage der Person, die Seiten seiner Freunde und Arbeitskollegen, seine Profile bei Facebook, Twitter, Xing usw. Es geht also um die Übertragung der realen Beziehungsnetzwerke (“everyone’s connected”) in die digitale Sphäre (“social graph”). Das Internet wird dadurch sehr viel enger und aussagekräftiger verlinkt als bisher:

Linked Data is about using the Web to connect related data that wasn’t previously linked, or using the Web to lower the barriers to linking data currently linked using other methods.

So praktisch das sein mag, wenn es darum geht, seine Freunde und Bekannte im Netz ausfindig zu machen – ganz abgesehen davon, dass ein derart ausgezeichnetes Netz die wildesten Träume vieler Netzwerkanalytiker übertreffen würde –, so problematisch ist diese Entwicklung, was die Missbrauchmöglichkeiten betrifft.

Was geschieht, wenn meine Seite (und damit meine virtuelle Identität) mit einer Person aus organisiert-kriminellem oder terroristischem Umfeld per Mikroformat verknüpft werden? Die Stärke eines dezentralen Systems (es gibt keinen “Datenbankadministrator, der Gott spielen kann”) werden hier zur Schwäche. Denn: Wer garantiert, dass die Verbindungen zu meiner Person, die auf anderen Webseiten formuliert werden, auch tatsächlich zutreffen? Denn die meisten dieser Formate sind, anders als LinkedIn-, Xing- oder Facebook-Freundschaften, nicht nur dezentral, sondern auch unidirektional, d.h. sie müssen nicht bestätigt werden.

Verschärft wird dieses Problem noch durch die Permanenz des Internet: wenn einmal an einer Stelle eine Beziehungsaussage über mich getroffen wurde, kann diese möglicherweise nicht mehr gelöscht werden, da sie über Archive aufgefunden werden kann (so scheint das Google Social Graph API, kurz: SGAPI, Beziehungsdaten zu cachen) oder bereits in zahlreiche FOAF-Datensätze auf anderen Seiten integriert wurde. Denn eine sinnvolle Möglichkeit, Beziehungsclaims zu zitieren (“Ich sage, dass Markus gesagt hat, Anne ist mit Peter befreundet”) gibt es meines Wissens noch nicht.

Das hat zur Folge, darauf hat danbri in seinem VortragSocial Network Portability” am 1. März in Cork hingewiesen, dass derartige Aussagen nicht als Tatsachenaussagen betrachtet werden dürfen, sondern nur als Behauptungen (“Claims”). Ein Semantic Web-Parser muss also in Betracht ziehen, welche Person hinter einer FOAF-Aussage steckt.

Einen möglichen Ausweg stellen Systeme wie SPARQL (kurz für “SPARQL Protocol and RDF Query Language”) da, die nicht nur die Aussagen aus dem semantischen Netz ziehen, sondern sich darüber hinaus auch dafür interessieren, an welcher Stelle und von welchem Akteur die Aussagen gemacht wurden. Hier geht es also nicht nur um die Frage: “Wer ist mit Peter befreundet?” sondern um “Wer sagt, dass Anne mit Peter befreundet ist?”

Momentan laufen erste Versuche, WordPress SPARQL-freundlich zu machen (“SparqlPress”). Damit werden zwei Ziele verfolgt: zum einen über einzelne Blogs Daten bereitzustellen, die mit SPARQL abgerufen werden können. Dadurch kann dann zum anderen das eigene Blog in eine automatisch aktualisierte Kontaktdatenbank verwandelt werden. Auf Grundlage der eigenen Kontaktliste können dann Aktivitätsströme erstellt werden, ähnlich zu den Facebook- und Xing-Statusmeldungen oder zu neuen Lifestream-Diensten wie Friendfeed. Mit dem FOAFnaut gibt es auch schon ein graphisches Interface, um das eigene FOAF-Kontaktnetzwerk zu visualisieren.

Wahrscheinlich lassen sich die Veränderungen, die sich durch die allmähliche Etablierung des Semantischen Netzes für das digitale Identitäts- und Beziehungsmanagement ergeben werden, überhaupt noch nicht in ihrer ganzen Tragweite erkennen. Zwei Punkte scheinen mir jedoch absehbar:

  • Klar ist, dass die in diesem Ausmaß noch nie da gewesene Archivierung und öffentliche Zugänglichkeit von Beziehungsdaten das digitale Identitäts- und Beziehungsmanagement zu einer sehr viel komplexeren Aufgabe machen wird. Das Prinzip “security through obscurity” wird es für diesen Bereich nur noch rudimentär geben: meine sozialen Beziehungen sind nicht mehr Teil der Privatsphäre, sondern öffentlich einsehbar.
  • Das professionelle Reputationsmanagement wird ein sehr wichtiges Geschäftsfeld werden, da für den Normalbürger die Kanäle gar nicht mehr absehbar sind, über die Informationen über die eigene Person verbreitet werden. Früher konnte man sich schon denken, wer ein Gerücht in die Welt gesetzt hat, heute sind es anonyme Maschinen, die Informationen aus unterschiedlichen Quellen kombinieren und als Ergebnis dann z.B. ein mit Ortskoordinaten versehenes Bild der eigenen Familie ausspucken.
  • Zugleich wird sich dadurch auch das Wesen der Suchmaschinen verändern, die nicht mehr allein zum Abrufen von Textinhalten genutzt werden können, sondern auch zum Abfragen von Beziehungsdaten.

Frei nach Kisch könnte man also schlussfolgern: Mit den Möglichkeiten des Semantischen Netz wird das Leben schöner, aber unsicherer.



Verwandte Artikel:
  • Netzwerkvisualisierung mit TwitterFriends
  • Netz, Web und Graph: Idealismus reloaded
  • Die Zukunft des WWW (Richard MacManus)
  • 3 Responses to “Unterwegs ins Semantische Netz oder: Was sind XFN, FOAF und SPARQL?”


    1. 1 czz

      Könnnte der Missbrauch nicht auch via Registrierung per DOI eingedämmt werden . Wir beschäftigen uns jetzt seit einem halben Jahr mit der Anmerldung Metadaten- Deskription von Digitalen Inhalten , und sind eines der ersten Mikromedium , die diesen internationalen Standard anwenden . AUCH aus Gründen des content- chutzes unserer autoren .

      http://www.zintzen.org/2008/02/27/metadaten-werkstatt-der-wert-schopfung/

    2. 2 Hans-Christoph Hobohm

      Das interessante daran ist, dass hier das “Semantische” Netz überhaupt nicht mehr semantisch ist, sondern in den Bereich der Pragmatik vordringt. Ganz im Sinne des “Social Life of Information”. Information ist eben vor allem kontextbezogen, pragmatisch und an Personen gebunden und nicht (nur) eine Frage der Semantischen Metadaten.
      Was bedeutet dies für Personen, die an den digitalen Netzen nicht teilnehmen? Steigt deren Informationsarmut? Kann man in der obscurity (weiter) leben?

    3. 3 Nick Weisser

      Wer suchet der findet – im semantischen Web hoffentlich noch viel effizienter als bisher. Ich bin sehr gespannt wie sich Herr Berner-Lees Kind durch die Pubertät hindurch entwickelt. Oder ist das Web als Ganzes noch früher in seiner Entwicklungsstufe einzustufen?

    Leave a Reply