Künstliche Intelligenz erobert die Datenbanken

Daten fürs Modell-Training

Die besseren Nutzungs- und Optimierungsmöglichkeiten von Databases sind aber nur ein Aspekt an der Schnittstelle KI und Datenbanken. Ein zweiter grosser Bereich, bei dem sich KI und Datenbanken nahekommen, ist das Training von KI-Modellen. Die «Big Challenges» bei Machine-Learning-Methoden wie Deep Learning sind die grossen Datenmengen und hohen Performance-Anforderungen. Daten plus Performance werden benötigt, um ein neuronales Netz beispielsweise auf komplexe Mustererkennung in Bereichen wie Bildklassifikation oder der Verarbeitung natürlicher Sprache zu trainieren. Und KI-Algorithmen und Daten müssen gut interagieren.
Bei diesem Zusammenspiel von Daten und KI-Algorithmen gibt es erheblichen Optimierungsbedarf. «Eine Datenbank, die im KI-Umfeld eingesetzt wird, sollte natürlich mit sehr grossen Datenmengen umgehen können», betont IBM-Experte Andreas Weininger. «Und sie sollte vor allem die Daten effizient in die KI-Algorithmen integrieren.»  So müssen beispielsweise Daten und KI-Algorithmen näher zusammengebracht werden, um das Training schneller und effizienter zu gestalten. Die etablierten Datenbank-Anbieter integrieren deshalb zusätzlich zu den erwähnten Funktionen auch immer mehr Technologien, um den Lern- und Trainingsprozess der KI zu verbessern.
Joseph Sirosh, ehemaliger Vice President in Microsofts Data Group, nannte als zentrale Neuerungen schon bei der Einführung von SQL Server 2017 Fähigkeiten wie Bilderkennung, Sprachanalysen sowie andere KI-Aufgaben, die direkt in den Datenbank-Server integriert sind. Ziel sei es, Machine-Learning-Prozesse, die normalerweise ausserhalb der Datenbank in einem separaten System abgearbeitet werden, zu vereinfachen und zu beschleunigen. «Der SQL Server ist jetzt nicht mehr nur ein Datenbank-Managementsystem», resümierte Sirosh damals. Der SQL Server sei das erste relationale Database-Managementsystem, das Datenbank und KI in einem System verknüpfe, so der Microsoft-Manager.
“Der SQL Server ist das erste relationale Database-Managementsystem, das Datenbank und KI in einem System verknüpft.„
Joseph Sirosh, Früherer Vice President von Microsofts Data Group
Inzwischen wurden die KI-Fähigkeiten mit dem SQL Server 2019 weiter ausgebaut. Vorläufig als Preview steht Azure SQL Database Machine Learning zur Verfügung. Der Service gibt Datenbank-Spezialisten Tools an die Hand, um grosse Datenmengen in SQL-Datenbanken direkt für Machine Learning zu nutzen, ohne die Daten bewegen zu müssen. 
«Big-Data-Cluster» für SQL Server, eine andere Innovation, flexibilisiert die Interaktion mit riesigen Datenmengen. Datenexperten können damit externe Datenquellen abfragen oder Daten aus mehreren externen Datenquellen über den Cluster nutzen. Die Daten lassen sich dann für KI, Machine Learning und andere Analyseaufgaben verwenden. 
Ähnliche Ansätze gibt es bei IBM. «Wir positionieren IBM Db2 als die Datenbank der Wahl für KI-Anwendungsentwickler und Datenwissenschaftler», heisst es in einer IBM-Mitteilung. So gibt es in Db2 etwa Stored Procedures, die Machine-Learning-Verfahren parallel in einem Cluster auf allen Datenbanken anwenden können. «Mit dieser Methode kann man mit grossen Datenmengen speziell im KI-Umfeld gut arbeiten», erklärt IBM-Fachmann Andreas Weininger.
Durch eine Reihe neu integrierter Treiber für datenwissenschaftliche Open-Source-Programmiersprachen und Frameworks wie Go, Ruby, Python, PHP, Java, Node.js, Sequelize und Jupyter Notebook wird es für Entwickler auch einfacher, maschinelle Lernmodelle mit Db2 zu analysieren und in Anwendungen einzubauen. KI-Experten und Datenwissenschaftler können auch kognitive Anwendungen innerhalb von Db2 unter Verwendung von IBM Watson Studio erstellen und Modelle trainieren - unabhängig davon, ob sich die Daten vor Ort mit Db2 oder in der Cloud mit Db2 on Cloud befinden. 



Das könnte Sie auch interessieren