Künstliche Intelligenz erobert die Datenbanken
GPUs als Turbo
Neben den Datensystemen der «alten Datenbankhasen», die bereits jahrelang auf dem Markt sind und nun um KI-Features erweitert werden, entsteht in jüngster Zeit eine ganz neue Klasse von dedizierten «echten KI-Datenbanken». Diese KI-Datenbanken sind speziell zur Beschleunigung des Machine-Learning-Modelltrainings und Inferencings konstruiert. Sie werben damit, KI-Anwendungen zu optimieren, indem sie Daten und Rechenoperationen für das Training und Inferencing von Deep-Learning-Modellen zusammenbringen und mit Hilfe von GPUs massiv parallelisieren.
Das Verlagern von KI-Workloads in eine GPU-beschleunigte KI-Datenbank bringt den Anbietern zufolge erhebliche Vorteile. Normalerweise werden die KI-Trainingsdaten in die spezialisierten GPU-Systeme transferiert, was mit Aufwand und Komplexität verbunden ist. Die extra angepassten KI-Datenbanken hingegen brächten die Algorithmen direkt zu den Daten. Das helfe, die Herausforderungen in Bezug auf die komplexe Datenverwaltung, die mit dem Machine-Learning-Training verbunden sind, besser in den Griff zu bekommen, und so Zeit zu sparen und Ressourcen zu optimieren.
Ein Beispiel für so einen Anbieter ist Kinetica. Das in San Francisco ansässige Start-up-Unternehmen hat eine verteilte SQL-Datenbank mit massiv paralleler Verarbeitung entwickelt, die für die schnelle Aufnahme und Analyse von Daten optimiert ist. Jeder Knoten verfügt dabei über Daten, CPU und GPU, die sich gemeinsam im Speicher befinden.
Über ein Funktions-Framework kann benutzerdefinierter Code direkt auf den Daten innerhalb der Datenbank ausgeführt werden. Dieser Code kann die Vorteile der parallelen Berechnung auf der GPU nutzen. Die Datenbank ist auch in der Lage, verteilte Berechnungen auf mehreren Rechnern durchzuführen. Algorithmen können in Sprachen wie Python geschrieben werden, die Datenwissenschaftlern vertraut sind und in Deep-Learning-Bibliotheken wie TensorFlow, Caffe und Torch aufgerufen werden.
Ob solche hochoptimierten, ausschliesslich auf KI-Belange ausgerichteten KI-Datenbanken eine Zukunft haben, ist allerdings ungewiss. Die Vergangenheit zeigte, dass Datenbank-Technologien, die für einen bestimmten Bereich optimiert waren, oft in die klassischen Technologien integriert wurden. Ob und wie dies bei KI-Datenbanken mit massiv paralleler Verarbeitung möglich ist, muss abgewartet werden.