Business Intelligence mit SQL Server 2005

Business Intelligence mit SQL Server 2005

Für grosse Datenmengen optimiert

In BI-Projekten werden sehr oft extrem grosse Datenmengen in Data Warehouse Datenbanken verwaltet. Das Data Warehouse integriert die Daten von allen involvierten Quellsystemen und sollte sie auch möglichst lange aufbewahren können. Nicht selten fallen so Daten im Terrabyte Bereich an. Damit solche Datenmengen effizient verwaltet werden können, muss die Datenbank darauf ausgerichtet sein. SQL Server 2005 unterstützt diese Anforderungen durch Partitioned Tables und Indexes.
Partitioned Tables verhalten sich aus Sicht des Anwenders wie eine normale Tabelle. Via Partition Function wird bestimmt, wo jeder einzelne Datensatz physisch gespeichert werden soll. Die Partition Function erlaubt es, Ranges zu definieren, nach welchen die Daten aufgeteilt und in File Gruppen gespeichert werden. Eine File Gruppe fasst ein oder mehrere physische Files zusammen. Indizes können ebenfalls auf den einzelnen Partitionen aufgebaut und so aufgeteilt werden. Dadurch können sie viel effizienter gepflegt werden, da nicht immer der komplette Index neu aufgebaut werden muss.
Analysis Services 2005

Mit den Cubes und Data-Mining-Modellen, die in Analysis Services erstellt werden können, wird es möglich, die Daten für den Anwender in eine verständliche Form zu bringen. Dazu dienen Dimensionen mit Drill-down-Hierarchien und abgeleitete Kennzahlen. Diese werden in den Würfeln an einer zentralen Stelle abgelegt und garantieren so konsistente Auswertungen. Für die Berechnung der abgeleiteten Kennzahlen steht mit MDX (Multidimensional Expressions) eine speziell dafür entwickelte Programmiersprache zur Verfügung.
Microsoft hat sich zum Ziel gesetzt mit Analysis Services 2005 die Flexibilität einer Relationalen Datenbank in die Cube Umgebung zu bringen. Dazu dient das Unified Dimensional Model (UDM). Das bedeutet, dass jedes Attribut das im Data Warehouse gespeichert ist, als so genannte Attribute Hierarchy (Category, Size, Color etc.) in einer Dimension verwendet werden kann. Mehrere Attribute-Hierarchien können dann zu User-Hierarchien zusammengefasst werden. Sie erlauben natürliche Drill-Down-Pfade (Year Quarter Month) abzubilden. Durch eine optimierte Struktur können nun Attribute wie auch User-Hierarchien zu einem Würfel hinzugefügt werden.
Neu wird auch das semi additive Verhalten der sogenannten Measures (Kenngrössen wie z.B. Einnahmen, Stückzahlen, Rabatt) unterstützt. Dazu stehen neben den bekannten Aggregats-Funktionen wie Sum und Count nun auch komplexere Funktionen wie AverageOfChildren oder LastNonEmpty zur Verfügung. Diese können entweder manuell bei einzelnen Measures oder aber mit Hilfe einer Account Dimension definiert werden. Wenn mit einer Account Dimension gearbeitet wird, dann erkennt Analysis Services automatisch, welche Aggregats-Funktion für welches Konto verwendet werden kann.



Das könnte Sie auch interessieren