12.02.2008, 08:57 Uhr
Aus Daten wird Wissen
Analysetechniken wie Online Analytical Processing (OLAP) haben sich durchgesetzt. Durch die Unmengen RAM in heutigen Servern ergeben sich zudem neue Anwendungsfelder für das Verfahren.
Angelika Güc ist Marketing Manager bei Cognos.
Es ist aus der modernen Firmeninformatik kaum wegzudenken: Online Analytical Processing (OLAP). Doch die Analysetechnik kann nicht nur im klassischen Sinn betrieben werden, nämlich als mehrdimensionale Sichtweise auf die Daten eines Unternehmens. Vor dem Hintergrund des enormen Wachstums in Sachen Speicher ergeben sich für OLAP-Lösungen noch viel interessantere Ansätze. Die Rede ist von Speicher-basierten OLAP-Lösungen, die für Unternehmen, die täglich auf die Analyse riesiger Datensätze angewiesen sind, wohl die Lösung der Zukunft sind. Zudem bescheinigen Analysten dem Markt für Speicher-basiertes OLAP in den kommenden Jahren ein enormes Wachstum. Mit Speicher-basierten OLAP-Lösungen lassen sich komplexe Datenstrukturen schnell und übersichtlich darstellen sowie bearbeiten. Zu den Anwendungsbereichen gehören beispielsweise das Controlling, das Supply Chain Management oder auch das Marketing.
Was ist Speicher-basiertes OLAP?
Speicher-basiertes OLAP ist eine Analysetechnik für Unternehmensdaten, bei der alle Daten im RAM (Random Access Memory) eines Rechners gehalten und alle Aggregationen, Kennzahlen und Werte in Echtzeit berechnet werden. Analysen im RAM eines Computers durchzuführen geht wesentlich schneller als auf einer herkömmlichen Festplatte. Das hängt unter anderem mit der tabellarischen Struktur des Arbeitsspeichers zusammen, der Binärwörter fester Grösse aufnehmen kann. Damit können im Speicher eines Computers Datenobjekte, Programme und die von diesen in Mikroprozessoren zu verarbeitenden Nutzdaten abgelegt und zu einem späteren Zeitpunkt abgerufen werden.
Allerdings ist der Arbeitsspeicher moderner Computer flüchtig. Das bedeutet, dass alle Daten nach dem Abschalten der Stromzufuhr wieder verloren gehen. Ganz ohne Festplatte geht es daher nicht, weshalb zur Datensicherung entweder ein Image auf der Festplatte mitgeschrieben wird oder die Daten beim Start jeweils neu geladen werden müssen. Die Volatilität der Arbeitsspeicher ist in den verwendeten dynamischen RAM (DRAM) begründet. Zwar gibt es Alternativen wie zum Beispiel magneto-resistive RAMs (MRAM), diese sind aber für die Verwendung als Arbeitsspeicher noch zu langsam.
Volatile Arbeitsspeicher haben aber auch ihren Vorteil: da die Daten nicht auf der Festplatte gespeichert werden müssen, geht dies auch nicht zu Lasten der Rechnergeschwindigkeit.
Speicher-basierte OLAP-Systeme profitieren enorm von der Entwicklung der letzten Jahre. Die Technik des Speicher-basierten OLAP war in der Vergangenheit hinsichtlich der Datenmengen limitiert. 32-Bit-Architekturen konnten maximal vier GByte RAM adressieren, für viele Unternehmen aus heutiger Sicht unvorstellbar. Dagegen bieten 64-Bit-Rechner-Architekturen heutzutage die Möglichkeit, fast unlimitierte Datenmengen mittels Speicher-basierter Analyse zu untersuchen. Kein Wunder also, dass sich 64-Bit-Systeme zunehmend verbreiten. Der Vorteil der Speicher-basierten Analyse liegt neben der hohen Performance - die insbesondere für den Anwender die entscheidende Rolle spielt - in der grossen Flexibilität, da in der Regel eine unbegrenzte Anzahl von Analysedimensionen betrachtet werden kann.
Den Speicher optimieren
Der Speicherbedarf und die Leistungsfähigkeit eines OLAP-Systems wird zudem dadurch bestimmt, wie effizient leere Bereiche in den OLAP-Würfeln eliminiert werden können. Das Verhältnis von leeren Zellen zu den Gesamtzellen eines OLAP-Würfels (engl. sparsity) ist in der Regel sehr hoch. Technisch betrachtet heisst das, dass die meisten Würfel fast nur aus Nullen oder leeren Zellen bestehen. Diese müssen über Algorithmen aus der Berechnung und aus dem Speicher eliminiert werden, um Speicherbedarf und Rechenleistung zu minimieren.
Laut einer Studie der International Data Corporation (IDC) mit dem Titel «Worldwide Business Intelligence Tools» wächst der Markt für Speicher-basierte Analysetechnik im Vergleich zum gesamten Business-Intelligence-Markt überdurchschnittlich. Bisher haben Hersteller wie Applix, die nun zu Cognos gehört, oder Infor den Trend zu Speicher-basierten OLAP-Lösungen erkannt und reagieren mit ihren Lösungen erfolgreich auf Kundennachfragen. Daneben existieren weitere Anbieter wie zum Beispiel das US-Unternehmen Spotfire sowie die schwedische Softwarefirma QlikTech, die mit QlikView eine Lösung anbietet, die Analysen von Informationen, die im Hauptspeicher gehalten werden, ermöglicht.
Begriffserklärung
Data Mining, Data Warehouse und OLAP
Moderne Speicher-basierte Analysetechnologien ermöglichen Unternehmen, ihre Daten so differenziert, komplex und detailliert zu analysieren und zu kontrollieren wie nie zuvor. Die Zeiten, in denen Informationen für Unternehmensentscheidungen in tagelangen und aufwendigen Prozeduren mühsam aufbereitet werden mussten, sind vorbei. Vielmehr bedienen sich Unternehmen heute zunehmend analytischer Informationssysteme wie Data Mining, Data Warehouse oder dem Online Analytical Processing (OLAP).
Data Mining bezeichnet die Anwendung statistisch-mathematischer Methoden auf einen Datenbestand mit dem Ziel, Informationsmuster zu erkennen bzw. verborgene wichtige Informationen zu extrahieren. Deshalb wird Data Mining oft im Zusammenhang mit grossen Datenbeständen genannt.
Ein Data Warehouse dagegen ist eine zentrale Datensammlung. In der Praxis ist das Data Warehouse meist eine Datenbank, deren Inhalt sich aus den Daten unterschiedlicher Quellen zusammensetzt. Die Daten werden von den Datenquellen in das Data Warehouse geladen und dort vor allem für die Datenanalyse und zur betriebswirtschaftlichen Entscheidungshilfe in Unternehmen gespeichert. Damit dient ein Data Warehouse der Informationsintegration.
Online Analytical Processing (OLAP), das auch den hypothesengestützten Analysemethoden zugeordnet wird, ist eines der beliebtesten analytischen Informationssysteme. Allerdings muss der Analyst vor der eigentlichen Untersuchung wissen, welche Anfragen er an das OLAP-System stellen möchte. Seine Hypothese wird dann durch das Analyseergebnis bestätigt oder abgelehnt. Im Vergleich zu relationalen Systemen, die immer einen zweidimensionalen Ansatz haben, bilden OLAP-Systeme die Datenstrukturen multidimensional in Datenpunkten ab. Sie beziehen ihre Daten entweder aus den operationalen Datenbeständen eines Unternehmens oder aus einem Data Warehouse. Einfache Auswertungen können bereits in den transaktionalen Systemen durchgeführt werden. Für komplexe und schnelle Auswertungen und Planungsprozesse sind diese architektonisch auf Buchungen ausgerichteten Systeme aber nicht geeignet.
Angelika Güc