Augmented Data Management 04.01.2021, 06:02 Uhr

Mit KI der Datenflut Herr werden

Intelligentes Datenmanagement ist die Basis für nutzbringende Analysen. Dabei unterstützen   Künstliche Intelligenz und Maschinelles Lernen.
(Quelle: ESB Professional / shutterstock.com)
Eines steht fest: An Daten, die sie erfassen, aufbereiten und analysieren können, mangelt es Unternehmen und Organisationen nicht. In der Studie «Global Datasphere 2020» taxiert das Marktforschungsunternehmen IDC den weltweiten Datenbestand auf derzeit 59 Zettabyte. Bis zum Jahr 2024 wird er ein Volumen von etwa 140 Zettabyte erreichen. Davon entfallen etwa 29 Prozent auf Daten in den Sparten Produktivität und «Embedded». Dies sind Informationen, die beispielsweise Geschäftsanwendungen erzeugen, aber auch Daten von Sensoren und «Dingen» wie vernetzten Maschinen, Fahrzeugen und Verkehrsleitsystemen.
Diese Informationsbestände bilden die Grundlage für den Aufbau digitaler Geschäftsmodelle. Das untermauert Christian Leutner, Head of Product Sales Europe bei Fujitsu TDS: «Unternehmen müssen heute Daten aller Art in Echtzeit erfassen, auswerten und in verwertbare ‚Insights‘ umsetzen. Nur dann sind sie in der Lage, einen geschäftlichen Nutzen aus ihren Datenbeständen zu ziehen.» Das erfordert Leutner zufolge eine datenorientierte (‚data-driven‘) Transforma­tionsstrategie. «Eines der Schlüsselelemente einer solchen Strategie ist der Einsatz von Künstlicher Intelligenz und maschinellem Lernen in Verbindung mit Data Science.»
Doch damit Data Scientists und die von ihnen eingesetzten KI- und Machine-Learning-Algorithmen zu «richtigen» Analyseergebnissen kommen, benötigen sie eine solide Datenbasis. Denn sonst tritt bei Data-Analytics-Projekten ein Effekt auf, der IT-Fachleuten schon seit vielen Jahren bekannt ist: «Garbage in - Garbage out». Das heisst, wenn fehlerhafte oder unpassende Informationen für eine Analyse herangezogen werden, dann ist das Ergebnis schlicht und einfach Datenmüll statt Insights.
“Die größte Hürde für eine klare Sicht auf die Daten sind die unterschiedlichen Datenquellen in einem Unternehmen.„
Daniel Fallmann, Gründer und CEO von Mindbreeze
Doch Garbage zu vermeiden, ist keine triviale Aufgabe, so Daniel Fallmann, Gründer und CEO des österreichischen Unternehmens Mindbreeze. Es hat sich auf Lösungen spezialisiert, die Daten und Dokumente aus unterschiedlichen Quellen erfassen, in einen Kontext einbinden und Nutzern zur Verfügung stellen. «Die grösste Hürde für eine klare Sicht auf die Daten sind die unterschiedlichen Datenquellen in einem Unternehmen. Eine weitere Herausforderung besteht darin, zu ermitteln, was das Unternehmen bereits weiss», sagt Fallmann. Ein zusätzliches Problem ist aus seiner Sicht, dass Datenquellen parallel ohne direkte Verbindung zueinander existieren - quasi als Datensilos. «Die Daten nur zu besitzen, bringt noch keinen Mehrwert. Erst wenn diese entsprechend aufbereitet wurden und dann im richtigen Moment und Kontext zur Verfügung stehen, können Unternehmen diese als Entscheidungsgrundlage heranziehen oder Arbeitsprozesse effizienter gestalten», so Fallmann weiter. Dafür müssten Datensilos aufgebrochen werden, um die Daten anschliessend mit Methoden der Künstlichen Intelligenz aufzubereiten.
So geht’s
Mit Augmented Data Management starten
Unternehmen, die mit Augmented Data Management starten möchten, sollten sich im Vorfeld mit den folgenden Punkten befassen:
Use Cases definieren: Anwender sollten prüfen, welche Einsatzmöglichkeiten von ADM für ihr Unternehmen in Betracht kommen. Ein Finanzdienstleister kann beispielsweise automatisch neue Portfolios mit Aktien und Anlageoptionen für bestimmte Kundengruppen erstellen. Die Grundlage bilden Metadaten, die eine Plattform für das Management und die Analyse vorhandener Kunden- und Marktdaten bereitstellt.
Eine Bankengruppe wiederum setzt ADM ein, um den Füllstand von Geldautomaten zu optimieren. KI- und Machine-Learning-Algorithmen schätzen ab, wann die Bargeldmenge in Automaten einen kritischen Punkt erreicht und ein Nachfüllen erforderlich ist. Dazu müssen jedoch Daten aus unterschiedlichen Quellen in diversen Formaten automatisch erfasst, aufbereitet und analysiert werden.
Mitarbeiter mitnehmen: Mitarbeiter stehen häufig Lösun­-gen mit KI- und Machine-Learning-Funktionen skeptisch gegenüber. Der Grund: Furcht um den Arbeitsplatz. Das ist möglicherweise auch bei den hauseigenen Datenspezialisten der Fall. Daher im Vorfeld klarmachen, dass Augmented Data Management kein Jobkiller ist, sondern den Data Scientists ungeliebte Routinearbeiten abnimmt.
Data Governance berücksichtigen: Beim Zugriff auf Daten über ein ADM-System müssen die geltenden Datenschutzregelungen berücksichtigt werden. Daher sollte der Zugang zu Informationen mithilfe von Regelwerken (Policies) gesteuert werden, die in der ADM-Software hinterlegt sind. Das verringert das Risiko, dass Datenlecks und Verstöße gegen die Datenschutz-Grundverordnung auftreten.
IT-Ressourcen anpassen: KI und Machine Learning sind Technologien, die hohe Anforderungen an Server, Storage und Netzwerkverbindungen stellen. Die IT-Ausstattung muss dementsprechend angepasst werden. Eine Option ist, für das erweiterte Datenmanagement eine Cloud-Plattform zu nutzen. Ein Großteil der Anbieter von ADM-Lösungen verfügt mittlerweile über eine Cloud-Version oder setzt auf einen cloudnativen Ansatz. Zu beachten sind dabei jedoch ebenfalls die Punkte Data Governance und Datenschutz.
Wahlfreiheit bei Implementierung und Nutzung: Im Idealfall steht eine ADM-Lösung allerdings nicht nur als Cloud-Plattform zur Verfügung. Vielmehr sollte der Anwender zwischen mehreren Nutzungsmodellen wählen können: einer Public Cloud, der Implementierung im eigenen Data-Center und einer Hybrid-Cloud.
Data Management und MLOps verknüpfen: Unternehmen sollten prüfen, ob sie ein Augmented Data Management mit einem MLOps-Ansatz (Machine Learning Operations) verknüpfen. Er bindet bei Datenprojekten neben Data Scientists und Datenspezialisten auch KI- und ML-Entwickler, die IT-Abteilung und die Fachabteilungen mit ein.



Das könnte Sie auch interessieren