02.03.2006, 17:08 Uhr
Auf Sinnsuche im Textdickicht
Forscher am Fraunhofer-Institut haben ein Softwaretool entwickelt, das nach inhaltlichen Zusammenhängen zwischen Texten fahndet.
Die hügelartigen Anhäufungen in der Darstellung von Swapit deuten auf Dokumente mit ähnlichem Inhalt hin.
Texte nach Stichworten zu durchsuchen und akzeptable Ergebnisse auszuspucken, dazu sind mittlerweile einige Suchmaschinen fähig. Geht es aber darum, inhaltliche Verknüpfungen zwischen den gefundenen Dokumenten aufzuzeigen, also der ganzen Sucherei auch einen Sinn zu geben, müssen die Textschnüffler meist passen.
Mit dem Softwaretool Swapit, das Forscher des Fraunhofer-Instituts für Angewandte Informationstechnik (FIT) in der Nähe von Bonn entwickelt haben, soll sich das ändern. Mit dem Werkzeug soll es möglich sein, inhaltliche Beziehungen in Textdaten herzustellen und mit diesen zusammenhängende Zusatzinformationen zu erschliessen.
Der Name Swapit, dem das englische «swap» zu Grunde liegt, was auf deutsch so viel wie «wechseln» bedeutet, ist laut FIT-Wissenschaftler Andreas Becks Programm. «Die Software fordert den Nutzer auf, Textinformationen unter wechselnden Blickwinkeln zu betrachten», führt er aus. «So kann er auch Zusatzinformationen zu den Dokumenten miteinander vergleichen», ergänzt Becks. Dazu präsentiert das Tool Textsammlungen als eine Grafik, die einer Landkarte oder einem Satellitenbild ähnlich sieht. Ähnliche Texte gruppieren sich dabei zu Hügeln zusammen. Klickt der Anwender auf diese Inhaltstrauben, so erfährt er anhand von bestimmten Merkmalen, wie die Texte zusammengehören. «Durch diese zusätzlichen Sichtweisen können Anwender ihre Daten viel ergiebiger auswerten, Statistiken erstellen und vorher verborgene Muster erkennen», betont Becks.
Neben der Inhaltsanalyse von Publikationen lassen sich mit Swapit auch andere Informationsquellen wie Kundendateien, Patentverzeichnisse und Unternehmensdatenbanken nach Quervergleichen durchforsten. Ob mit dem Werkzeug im Sinne von Business Intelligence und Knowledge-Management - um nur einige der derzeit kursierenden Schlagwörter zu nennen - tatsächlich das verborgene Wissen eines Unternehmens oder einer Institution gehoben werden kann, wird derzeit noch in der Industrie und an Forschungsanstalten getestet. Als Beispiele nennt das FIT den Anwender eines CRM-Systems (Customer Relationship Management), der anhand von Swapit herausfindet, welche Eigenschaften Kunden haben, die sich mit ähnlichen Wünschen an sein Unternehmen wenden. Oder die Marketingabteilung erkennt anhand der Fragen an die Helpdesk, welche Funktionen die Anwender vermissen.
Diese Feldversuche förderten teils überraschende Ergebnisse zu Tage, berichtet Becks. «In einem interdisziplinären, kulturwissenschaftlichen Projekt hat Swapit sogar Kommunikationsschwierigkeiten gelöst», meint der FIT-Mann. Hier habe es aufgezeigt, wie unterschiedliche Disziplinen den gleichen Begriff definieren und daher im wahrsten Sinne des Wortes aneinander vorbeireden.