02.06.2005, 13:43 Uhr
XML-Datenbanken werden reif
Als Basis von Web-Content Management-Systemen gewinnen XML-Datenbanken an Bedeutung. Unsere Schwesterpublikation «Infoworld» hat daher drei der gängigsten nativen XML-Datenbanken unter die Lupe genommen. Es sind dies Xindice 1.0 von der Apache Foundation, Berkley DB XML 2.1 von Sleepycat und Exist, das auf der Open-Source-Projektseite Sourceforge.net publiziert wird. Alle XML-Datenbanken sind quell-offen und gratis.
In Sachen Datenbanken und Content-Management-Systemen (CMS) haben viele ein Augenmerk auf die Extensible Markup Language (XML) im Allgemeinen und die zugehörigen XML-Informationssammlungen im Speziellen geworfen. Letztere sind sozusagen das Fundament, auf dem manches XML-CMS fusst. Unsere Schwesterpublikation «Infoworld» hat daher drei der gängigsten nativen XML-Datenbanken unter die Lupe genommen. Es sind dies Xindice 1.0 von der Apache Foundation, Berkley DB XML 2.1 von Sleepycat und Exist, das auf der Open-Source-Projektseite Sourceforge.net publiziert wird. Alle XML-Datenbanken sind quell-offen und gratis. Einschränkungen bestehen nur beim Produkt Sleepycat in Bezug auf kommerzielle Softwareprojekte.
Apaches Xindice ist aus dem Projekt DB-XML Core hervorgegangen und firmiert seit 2001 unter genannter Bezeichnung. Die Xindice-Urheber machen keinen Hehl daraus, dass das Tool sich an Entwickler richtet, die lediglich XML-Daten speichern und manipulieren wollen. Es speichert die Informationen in sogenannten Kollektionen. Vom Prinzip her sind diese vergleichbar mit Ordnern und Unterordnern im Dateisystem. Im Gegensatz zur Berkley DB XML kann Xindice allerdings nicht mit allzugrossen Dateien - die Grenze liegt bei gut einem MByte - umgehen. Für die Abfrage verwendet das Apache-Tool X-Path. Schöner wäre es, so die Tester, wenn Xindice sich mit X-Query befragen liesse.
Auf X-Query versteht sich dagegen Berkley DB XML 2.1 von Sleepycat, das allgemein als reifer beurteilt wird als Xindice. Aber auch mit X-Path und X-Update kommt das Werkzeug klar. Zudem lässt sich das Tool auch mit grösseren XML-Dateien ein und unterstützt bis zu 256 TByte grosse Datenbanken. Berkley ist im Gegensatz zu Xindice kein Client/Server-System, sondern eine Bibliothek, die mit der zugehörigen Applikation verhängt wird.
Bei der dritten untersuchten XML-Datenbank handelt es sich um Exist, das noch einer Version 1.0 harrt. Exist ist nicht im gleichen Umfang skalierbar. Aber durch seine einfache Installation, übersichtliche Dokumentation und seinen umfassenden Programmierschnittstellensatz ist Exist ideal für Leute, die eine anständige XML-Datenbank in überschaubarer Zeit auf die Beine stellen wollen. Zudem spielt X-Query in dieser Datenbank eine zentrale Rolle. Durch eigene Erweiterungen wird der Dialekt von der simplen Abfragesprache zur Umgebung, mit der sich ganze Websites steuern lassen.
Zum Besseren Verständnis:
Jeder will XML-Datenbank sein
Der Markt für XML-Datenbanken (Extensible Markup Language) ist recht unübersichtlich. Dies vor allem deshalb, weil selbst diejenigen Hersteller von Datenbanken, die Abfrageergebnisse im XML-Format anliefern, ihre Produkte als XML-Datenbanken bezeichnen. Eine bessere Bezeichnung wäre wohl XML-Middleware, da sie zwischen relationalen Datenbanken als Quelle und XML-Dateien als Ausgabemedium lediglich als Mittler dienen. XML-Datenbanken im engeren Sinn, sogenannte native XML-Datenbanken, können dagegen XML-Daten auch speichern, lesen und verarbeiten.
Da sich XML zur Lingua franca der webgestützten Computerei entwickelt, werden auch die entsprechenden Informationssammlungen als deren Drehscheibe an Bedeutung gewinnen. Dies obwohl sie gegenüber relationalen Datenbankmodellen auch Nachteile aufweisen. So ist XML ein hierarchisches Dateiformat, was in Datenbankkreisen als überholt gilt. Auch die beiden Abfragesprachen X-Path und X-Query können der im rela-tionalen Datenbankumfeld gebräuchlichen Structured Query Language (SQL) noch nicht das Wasser reichen, vor allem beim Zugriff auf grosse Datenmengen.