Praxis 20.05.2015, 08:11 Uhr

Wie unstrukturierte Daten zu Wissen werden

Rund 80 Prozent aller von Unternehmen und Behörden verwalteten Informationen liegen in unstrukturierter Form vor. ELCA bietet Lösungen an, diese grossen Mengen an Daten effizient zu bearbeiten und in verwertbares Wissen umzuwandeln.
Jetzt den ELCA-Newsletter abonnieren
Content Analytics – zu Deutsch die «Analyse von Inhalten» – beschreibt die Anwendung von Business-Intelligence-Verfahren und Analysemethoden von digitalen Inhalten. Die sinnvolle Nutzung von Daten ist heutzutage unumgänglich. Geschätzte 80 Prozent der täglich verwalteten Informationen in einer Organisation liegen in unstrukturierter Form vor. Dies können beispielsweise Textdokumente, Bilder, Audio- und Videoinhalte sein. Da aber die Mehrheit der Informationen entweder als Text entwickelt wurde oder zu Text konvertiert wird, ist die automatische, computergestützte Verarbeitung natürlicher Sprache – das «Natural Language Processing» (NLP) – ein Schlüsselfaktor für Content Analytics. NLP ist eine Disziplin, die in den 50er Jahren entwickelt wurde und die künstliche Intelligenz, Linguistik und Statistik kombiniert. Verteidigungsinstitutionen trieben NLP voran, da gerade in diesem Bereich die Fähigkeit sehr wichtig ist, menschliche Interaktion möglichst schnell durchsuchen, transkribieren, zusammenzufassen und übersetzen zu können. Heutzutage wird die NLP-Technologie in vielen Branchen und Bereichen angewendet, z.B. im Digitalen Marketing, im Finanzbereich, in Call-Centern etc. Mit umfassenden wahrscheinlichkeitstheoretischen Ansätzen und numerischen Evaluationsmetriken erschliesst NLP die verborgene Semantik / Bedeutung unstrukturierter Informationsquellen. Dies können unter anderem Freitextdokumente, Mikroblogs oder Telefongespräche sein. In anderen Worten bietet NLP den Schlüssel, um Daten von unterschiedlichen Herkunftsquellen in Wissen zu konvertieren, das heisst, die Informationen in verwert- und umsetzbares Wissen («actionable intelligence») umzuwandeln. Auch gescannte Dokumente können verarbeitet werden, indem sie mithilfe der optischen Zeichenerkennung («Optical Character Recognition») maschinenlesbar gemacht werden. Bildverarbeitende Techniken werden für die Gesichtserkennung von Foto- und Videomaterial angewendet. Dies kann dabei helfen, das Bild über das soziale Netzwerk einer Person zu komplettieren oder fehlende Verbindungen oder Beziehungen beispielsweise zu anderen Personen oder Einheiten zu identifizieren. NLP ist ein wesentlicher Faktor in der Entscheidungshilfe, da Textdaten nach interessanten Einheiten oder Ereignissen durchsucht und analysiert sowie Muster und Sachverhalte identifiziert werden, die eine weitere Untersuchung  verdienen», sagt Yves Burki, Geschäftsbereichsleiter BI und (Big) Data Science bei ELCA. Was die ELCA-Lösung bietet Mit ihrem umfangreichen Wissen und Erfahrungen im Umfeld von NLP, Suchtechnologien und verwandten Lösungen, unterstützt ELCA Unternehmen dabei, die Content-Analytics-Technologie wirksam einzusetzen und so alle Arten von unstrukturierten Informationen umgehen zu können.
Das ELCA-Dashboard Das ELCA-Dashboard für Content Analytics aggregiert Informationen von News-Websites und sozialen Netzwerken in suchbasierte Applikationen, einschliesslich einer Freitextsuche in News, Blogs und Tweets, ein automatisches Extrahieren von Personen, Plätzen und Organisationen sowie die effektive Visualisierung von Themen, Einheiten und Beziehungen via Tag-Clouds und Netzwerk-Grafiken. Zudem ist eine Sentiment-Analyse in Echtzeit möglich. Monitoring sozialer Netzwerke und Profiling Viele Institutionen sind daran interessiert, Nutzer sozialer Netzwerken zu analysieren – beispielsweise jene User, die ein gemeinsames Interesse für eine bestimmte Organisation, Person oder Thematik haben (z. B. «Follower von @WEF», «Personen, die Beiträge zu Big Data verfassen», «Personen, die @BarackObama erwähnen oder entsprechende Tweets weiterverbreiten» etc.). Mit der «Social-Networking-Profiling»-Applikation von ELCA können die Organisationen:
  • die aktivsten Follower eines bestimmten Profils bestimmen
  • das wahrscheinlichste Sentiment, den Ort, die Altersgruppe und das Geschlecht eines Nutzers bestimmen
  • die Entwicklung von Themen im zeitlichen Verlauf darstellen
  • periodisch Berichte über interessante Profile erhalten inklusive Informationen über die Follower, Meinungsführer und einflussreiche Social-Media-Nachrichten und -Botschaften.


Das könnte Sie auch interessieren