01.06.2006, 17:08 Uhr

Gleichberechtigung für XML

Die nächste Version von IBMs Datenbank DB2 behandelt das aufstrebende Internetformat XML wie die altgediente Abfragesprache SQL.
Mit Viper, der nächsten Version von IBMs DB2, wird der alterwürdigen Datenbankabfragesprache SQL (Structured Query Language) die junge Internetsprache XML (Extensible Markup Language) gleichberechtigt zur Seite gestellt.
Noch diesen Sommer steht das nächste grosse Update der Datenbank DB2 von IBM an. Das Informationsverwaltungsprogramm wird schon seit Längerem unter der Bezeichnung «Viper» entwickelt und hat mittlerweile die öffentliche Betaphase erreicht. Auf der entsprechenden Seite im Internet lässt sich eine Version zu Testzwecken herunterladen.
Grund genug für unser Testlabor, mit dem Flaggschiff des Blauen Riesen einen ersten kleinen Törn zu wagen. Besonderes Augenmerk galt dabei dem Umgang der DB2-Weiterentwicklung mit XML (Extensible Markup Language). Viper soll mit einer separaten Datenbankmaschine für XML aufwarten, wodurch die im Internet reüssierende Sprache gleichberechtigt neben dem traditionellen Abfrageverfahren für Datenbanken, SQL (Structured Query Language), ihren Platz findet. Im Gegensatz zu Konkurrenten wie Microsoft und Oracle, die strukturierte CLOB (Character Large Objects) verwenden, um XML-Dokumente in ihren Datenbanken abzulegen, hat IBM ein eigenes Speicherformat kreiert. Dieses weiss Herstellerangaben zufolge XML besser und effizienter zu handhaben. Das Verfahren basiert auf einem parallelen Datenmanager, der XML-Dokumente in ein hierarchisches Format überführt. Dadurch sollen XML-Files ohne Leistungseinbussen durchforstet werden können. Eine weitere Neuerung, mit der Viper aufwartet, ist das Kompressionsverfahren, das IBM etwas irreführend als «Row Level» bezeichnet. Tatsächlich wird nicht auf Zeilen- sondern Tabellenebene komprimiert. Unabhängig davon, wie glücklich dessen Bezeichnung ist, soll es Speicherplatz in Höhe von durchschnittlich 45 bis 75 Prozent sparen helfen, abhängig vom Datentyp. Um diese Aussage zu überprüfen, hat das Testlabor eine 40 GByte grosse Tabelle mit gut 500 Millionen Zeilen erstellt, die sowohl numerische Daten und Textinhalte aufwies. Diese wurde in ein Textfile exportiert und hernach in ein komprimiertes Tabellenformat überführt. Nach diesem Prozedere beanspruchte die Informationssammlung nur noch 17,75 GByte, was einer Stauchrate von 56 Prozent entspricht. Allerdings änderte sich die Performance durch die Komprimierung nur unmerklich. Ein weiteres Highlight von Viper - neben Bequemlichkeiten wie einem XQuery-Builder für spezielle XML-Abfragen - ist die Möglichkeit, Tabellen zu partitionieren. Dadurch können die Daten zweckgebunden aufgeteilt werden, je nach dem ob eher in Sachen Storage oder Performance geschraubt werden soll. So ist der Datenbankadministrator in der Lage, Wartungsarbeiten an einzelnen Partitionen auszuführen.



Das könnte Sie auch interessieren