Archive for the 'semanticweb' Category

Metadaten in Tageszeitungen – oder: wie man Merkel und Putin verwechseln kann

Sehr schön, was der “Medienhacker” Dave Winer auf dieser Seite mit dem NY-Times-Newsfeed anstellt: er filtert aus allen neuen Nachrichtenartikel die Keywords heraus und erstellt eine Rangfolge. Beziehungsweise: nicht er macht das alles, sondern ein Script. Möglich wird das dadurch, dass alle (jedenfalls die meisten) Artikel der NY Times auf vorbildliche Weise mit Metadaten versehen sind. So findet man zum Beispiel im Quelltext der Nachricht “In Iran, Putin Warns Against Military Action” folgende Metadaten, die sich alle per Computer auslesen und weiterverarbeiten lassen:

  • Kurzbeschreibung
  • Schlagworte
  • Datum
  • Titel
  • Autor
  • Themengebiete
  • Personen
  • Geographischer Kontext
  • Ressort

Ein Computer könnte diesen Metadaten entnehmen, dass sich das berichtete Ereignis auf Russland und den Iran bezieht, dass es mit Vladimir Putin und Mahmoud Ahmadinejad zu tun hat sowie dass es dabei um Internationale Beziehungen und Atomenergie geht. Damit lässt sich schon eine Menge anfangen und ohne großen Aufwand Verknüpfungen zu anderen Nachrichten herstellen. Fehlt nur eine geeignete Darstellungsform, um der Leser könnte durch diese Angaben “Pivot-Browsen“, also immer wieder einen neuen Ausgangspunkt auswählen, sei es ein Ort, eine Person oder ein Thema, und von dort aus neue Beiträge entdecken. Vielleicht sogar in anderen Nachrichtenquellen oder gar Medienformen (GoogleEarth, Youtube, Facebook).

Sieht man sich dagegen die deutschen überregionalen Tageszeitungen an, so kann man nur einen gewaltigen Aufholbedarf feststellen. Der Artikel zum selben Thema in der Süddeutschen Zeitung wartet zwar mit einigen Keywords auf, doch diese wollen mir doch tatsächlich weißmachen, es gehe in dem Artikel um “Bush”, “Cofi Annan”, “Saddam”, den “Bundestag” oder um “Steuer”. Davon, dass “Saddam” und “Cofi Annan” schon etwas länger Geschichte sind, will ich gar nicht reden.

Weiter zur FAZ, die ebenfalls einen Artikel zu Putins Solidaritätserklärung parat hat. Aber auch hier ist das semantische Netz zerrissen, denn ein Computer würde zu dem Ergebnis kommen, der Artikel thematisiere “Merkel”, die “EU”, “Steuern” und irgendeine “Wahl”.

Die Welt hat keinen Artikel direkt zu dem Thema, also habe ich mir einen Beitrag über die Terrorrisiken der Putinreise ausgesucht. Auch hier führen die Metadaten zunächst ins Leere, denn mit “Urlaub”, “Sport” und “Satire” hat das nichts zu tun. Aber halt! Ganz am Ende der Keywords doch noch ein paar sinnvolle Hinweise: Iran, Russland, Wladimir Putin, Staatsbesuch, Atomenergie, Anschlag. Gar nicht übel, aber schlecht auszuwerten.

Zum Schluss noch zur taz, wo mich wieder nur Standardkeywords erwarten, außer hinter der Wahl von Schlagworten wie “politische Karikatur”, “Cartoons” und “Comic” steckt eine tiefere Absicht? Klar ist: ein Computer würde beim Versuch, diesen Humor zu entschlüsseln, versagen.



Verwandte Artikel:
  • Online verdrängt Print: Studie befasst sich mit den Digitalisierungsverlierern Tageszeitungen
  • Gruscheln als Alternative zum Nachrichtenkonsum?
  • Das lange 19. Jahrhundert der Zeitungsmacher
  • Tag ‘n’ Roll

    Kaum habe ich das neue Tagging-Feature in die metaroll eingebaut, haben die ersten Besucher schon gemerkt, wie das funktioniert und legen los. Gerade eben waren schon gut 40 Einträge mit Tags versehen; ich wette, wenn die ganzen Blogbesitzer morgen ihr eigenes Blog suchen und taggen, werden noch einmal eine ganze Menge dazukommen.

    Schön wäre ja, statt der üblichen Tagcloud, die nur die Häufigkeiten angibt ein Tagnetz zu entwerfen, das auch die Beziehungen zwischen den Blogs angibt (die sich direkt der Blogrollverlinkung entnehmen lassen). Mal sehen. Aber jetzt seid erst mal ihr dran.



    Verwandte Artikel:
  • No related posts