nandooWas Google News nicht kann, macht nandoo.net zum Prinzip: Texte verstehen. Das Portal aus Potsdam wertet Nachrichten aus verschiedensten Quellen (darunter viele dpa-Texte) nach einem computerlinguistischen Verfahren aus. Als "Text-Verstehmaschine" rafft das System worum's geht und kann doppelte oder überflüssige Infos herausfiltern. Der Nutzer bekommt wertvolle Inhalte zu seinem ganz bestimmten Interesse - auch aus Quellen jenseits von Spiegel Online. Kleine Content-Anbieter "aus der zweiten Reihe" wittern schon ihre Chance auf Google-unabhängige Aufmerksamkeit.

web_klein"Wir kippen Texte rein, die Maschine rödelt alles durch und kann dann sagen, worum es inhaltlich geht". So beschreibt CyberConsult-Geschäftsführer Jens Landvogt stark vereinfacht das Verfahren, mit dem sein Portal nandoo.net arbeit. Während Google News einfach Texte nach einzelnen Suchbegriffen filtert, bedient sich nandoo.net Methoden der Computerlinguistik und macht somit auch unstrukturierte Freitext-Dokumente semantisch verständlich. Eine "Text-Verstehmaschine" nennt Landvogt sein Projekt, das auch mit verschiedenen Begriffen für ein- und dasselbe zurecht kommt. Wer sich für München interessiert, bekommt auch Texte über die "Isarmetropole", wer nach dem Papst sucht, findet auch Artikel über Joseph Ratzinger und Benedikt XVI., selbst wenn der gesuchte Begriff im Text gar nicht vorkommt.

nandoo-themenreihe

News zu Themen, für die es keinen Suchbegriff gibt.

Neben vordefinierten Themenbereichen kann jeder Nutzer seine eigenen Themenbereiche kreieren, zu denen er maßgeschneiderte Infos haben möchte. Dazu gibt er dem System einige Beispiel-Artikel, die das Thema behandeln. Das System ermittelt dann den "semantischen Kern" der Nachricht und verwendet diese Informationen für die Suche nach passenden Dokumenten. Die Themengebiete können Nachrichten über Unternehmen, Promis oder den Lieblingsfußballverein enthalten, aber auch Themen, die sich nicht mit einem Suchbegriff umschreiben lassen. Als Paradebeispiel nennt Jens Landvogt das Thema "Seltsame Stürze". Ein Mensch weiß, dass es wohl darum geht, dass irgendjemand auf irgendeine Weise hinfällt und sich dabei wohl irgendwie verletzt oder zu Schaden kommt. Die sonst so allmächtige Suchmaschine Google kommt mit dem Begriff gar nicht zurecht, nandoo.net dagegen schon.

nandoo-sprechText-Remix.

Seine volle Wirkung zeigt diese Herangehensweise erst auf den zweiten Blick - bei der so genannten Slider-Funktion. Mit einem Schiebe-Regler lassen sich lange Texte stufenlos kürzen. Statt einfach hinten abzuschneiden, fällt das weg, "was das System für entbehrlich hält", erklärt Landvogt. Das funktioniert jedoch nur mit Texten, die nandoo.net im Volltext anzeigen kann - momentan also beim dpa-Online-Angebot. Der nächste Schritt ist schon in Planung: nandoo-slider-logoBald sollen thematisch ähnliche Texte aus unterschiedlichen Quellen automatisch zusammengeführt werden. Redundante Informationen kommen nur noch einmal vor und werden mit Detailinformationen gemischt, die nur in einer Quelle stehen. Auch soll's künftig möglich sein, sprachübergreifend und nach den Vorlieben und Fähigkeiten des Nutzers zu suchen. Bekommt das System beispielsweise einen deutschen Beispieltext, könnte es auch nach englischen Beiträgen zum Thema suchen, französische aber außen vor lassen, weil der Nutzer kein Französisch spricht.

Marktplatz für Content-Anbieter.

Neben dem Nutzen für die Leser sieht Jens Landvogt in nandoo.net vor allem Möglichkeiten für kleinere Content-Anbieter jenseits von Spiegel Online: Die meisten Nutzer grasen täglich nur eine Handvoll Quellen ab. "Was im Rest der Welt passiert, geht an ihnen vorbei", gibt er zu bedenken. "Wir wollen weg von der Quellenorientierung, hin zur Themenorientierung." Hat also eine Quelle einen Text, der genau auf das Themenprofil eines Nutzers zutrifft, bekommt er ihn zu lesen, auch wenn er die Quelle vorher sonst nicht beachtet hätte. nandoo.net wertet im Moment 15 Quellen aus, darunter dpa, Spiegel Online, sueddeutsche.de, tagesschau.de und auch Special-Interest-Seiten wie deutsche-startups.de. Bis auf die dpa-Meldungen werden auf der Seite nur Teaser zu den Originalartikeln angezeigt, erst später will Landvogt mit den Inhalte-Anbietern über eine Volltext-Übernahme verhandeln. Doch schon jetzt hätten sich etliche "Content-Anbieter aus der zweiten Reihe" gemeldet und angefragt, wie auch ihre Inhalte in die Auswertung kommen könnten. Da die Anbindung neuer Quellen je nach verwendetem Datenformat aber jeweils bis zu einem Tag in Anspruch nimmt, setzt das kleine Unternehmen andere Prioritäten: Die Optimierung von Algorithmen und der Benutzeroberfläche hat momentan Vorrang. Zudem steht der Webserver noch im eigenen Haus und lässt die Seite unter der lahmen Internetanbindung in Potsdam leiden. Schon bald soll das Angebot daher in ein modernes Rechenzentrum umziehen. Die Zahl der Quellen soll dann auf über 100 steigen.

Ein Bündel an Geschäftsmodellen.

nandoo-topthemenNatürlich will Jens Landvogt auch Geld verdienen. Eines seiner vielen Erlösmodelle funktioniert in Anlehnung an Google-Adwords. Statt ein einzelnes Suchwort zu buchen, könnten Content-Anbieter sich als Experte für ein bestimmtes Thema profilieren und gesondert angezeigt werden. Seine Idee: "Weg von ‚Werbung finanziert Content’ hin zu ‚Content ist Werbung’". Die Inhalte-Anbieter sollen also über ihr Produkt, also ihre Texte, im Gedächtnis der Leser bleiben. Daneben denkt CyberConsult über Premium-Accounts, Whitelabel-Lösungen und Widgets für externe Seiten nach. Dort könnte eine Box angezeigt werden, in der in Echtzeit Teaser-Texte passender Neuigkeiten eingeblendet werden, quasi eine Art intelligenteres Google News für jedermann. Website-Betreiber können ihren Besuchern auf diese Weise automatisch passende Neuigkeiten anbieten. Und Unternehmen können ihren Mitarbeitern im Intranet speziell gefilterte Nachrichten über die Firma, die Konkurrenz oder das Marktumfeld liefern. Chancen bieten sich viele.

Ursprünglich nur zur Demonstration gedacht.

CyberConsult befasst sich übrigens schon seit 1997 damit, Inhalte maßgeschneidert aufzubereiten. Den Anfang machten Online-Produktberater, die strukturierte Informationen aus einer Datenbank individuell zusammenführen. Später machten sich die Entwickler daran, auch unstrukturierten Freitext zu analysieren und auszuwerten. Bei der Entwicklung der Technologie arbeitet CyberConsult mit dem Computerlinguistiker Prof. Dr. Manfred Stede von der Uni Potsdam zusammen. Die Forschung wurde vom Bundesministerium für Wirtschaft und Technologie mit rund 500.000 Euro gefördert. Das Projekt, aus dem nun nandoo.net geworden ist, war ursprünglich nur als Showcase gedacht, um Verlagen IT-Lösungen zu verkaufen. Die Idee: Mittels computerlinguistischer Methoden werden die Angebote verschiedener Blätter eines Hauses thematisch gebündelt. Ein großes deutsches Verlagshaus hat die Technologie dahinter damals gekauft, aber nie online zum Einsatz gebracht. Für Jens Landvogt ist das bis heute ein Rätsel und ein guter Grund, nandoo.net selbst im Web zu pushen.

Weiterführende Links:

nandoo.net: nandoo.net - Das News Discovery Network.