07.11.2011, 16:56 Uhr
Sybase optimiert Big-Data-Analyse
Tempo-Runde bei Sybase: Die neue Version des Big-Data-Servers IQ wird noch schneller. Schweizer Unternehmer wissen die Performance-Vorteile zu schätzen.
Sybase hat Feintuning betrieben und seinen Analytics-Datenbankserver Sybase IQ 14.4 weiter verbessert. Die Lösung ist auf die schnelle Analyse riesiger Datenbestände spezialisiert, kommt auch mit unstrukturierten Daten zurecht und teilt komplexere Queries in mehrere, gleichzeitig laufende Abfragen auf (PlexQ-Technologie). Hinter Sybase IQ steckt im Wesentlichen eine kolumnenorientierte Datenbank, plus Hadoop und MapReduce. Hadoop ist ein in Java geschriebenes Open-Source-Framework für skalierbare, verteilt arbeitende Software. Die Idee dahinter: Auf mehrere Schultern respektive Rechner verteilte Arbeiten gehen schneller von der Hand. Die Hadoop-Komponente MapReduce überführt ausserdem unstrukturierte Daten - wie zum Beispiel Texte, E-Mails oder Sensordaten - in ein schnell analysierbares Format. Auch die Arbeitsschritte von MapReduce lassen sich relativ leicht parallelisieren. Seit 2010 hält Google ein US-Patent darauf.
Performance-Turbos bei Sybase IQ
Gleichzeitig laufende Teilabfragen, das für Computer-Cluster, also mehrere parallele Rechner, geschriebene Hadoop und MapReduce verpassen den Analysen grosser Datenbestände einen riesigen Performance-Schub. Darunter liegt eine kolumnenorientierte, dass heisst auf Analytics spezialisierte Datenbank. Nicht von Ungefähr hat Sybase IQ in Echtzeit-Branchen wie Börsen-Tradiing, Kreditkarten-Abrechnung oder Financials eine hohe Verbreitung gefunden. Zu den Highlights der neuen Version 15.4 zählen, so Sybase, unter anderem: 1) Eine native MapReduce-API (Application Programming Interface) unter Verwendung von, wie Sybase das nennt, In-Database-Analytics, 2) Hadoop-Integration in Sybase IQ und In-Database-Analyse-APIs, 3) Predictive-Model-Markup-Language-Support (PMML): Die PMML automatisiert über ein zertifiziertes Plug-in des Sybase-Partners Zementis die Ausführung von Analysemodellen, 4) hohe Komprimierung von Textdateien, 5) schnelleres Bulk Loading grosser Datenmengen über ODBC- und JDBC-Schnittstellen. Macht sich SAP mit Sybase IQ eigentlich selbst Konkurrenz? Seit Mai 2010 gehört der Analyse-Spezialist Sybase zum ERP-Weltmarktführer aus Walldorf, und der trommelt seit einem Jahr für seine neue In-Memory-Analytics-Maschine HANA. Auch HANA ist kolumnenorientiert und verarbeitet Riesendatenberge in Echtzeit, also rasend schnell. Nach Joydeep Das, Director for Analytics bei Sybase, spielen die beiden Lösungen eher komplementär verteilte Rollen in der Big-Data-Analyse. HANA empfehle sich für die Echtzeit-Analyse operationaler Daten, die aus SAP-Applikationen kommen. Sybase IQ dagegen glänze in sehr grossen Enterprise-Datawarehouse-Architekturen mit einer Vielzahl von Anwendern und Daten.