14.10.2010, 11:08 Uhr
Daten-Bagger der Superlative von EMC
EMC will Unternehmen bei der Verwaltung riesiger Datenmengen unter die Arme greifen und lanciert die Greenplum Data Computing Appliance.
Die Data-Warehouse-Appliance basiert auf der massivparallelen Verarbeitungstechnik von Greenplum, einer Firma, die EMC im Juli gekauft hatte. Sie ist darauf spezialisiert, sehr grosse Infromationsmengen in kürzester Zeit zu verarbeiten.
Laut EMC soll die Greenplum Data Computing Appliance dabei zweimal flinker sein als Konkurrenzprodukte, namentlich Oracle Exadata, IBM Netezza und das Data-Warehouse-Angebot von Teradata. Demnach lassen sich in einem Rack 10 Terabyte Daten pro Stunde verarbeiten.
Wie Scott Yara, ehemaliger Greenplum-Präsident und heute Leiter der entsprechenden Produktelinie bei EMC, ausführt, richte sich das Gerät an Firmen, die riesige Datenmengen analysieren und zu sinnvollen Informationen aufbereiten wollen. Die Produkte richten sich in diesem Zusammenhang etwa an Carrier und Provider. "Netzwerkgeräte beispielsweise produzieren mehr Daten als Menschen dies je könnten. All die Handys, Sensoren und Router registrieren Millionen von Events pro Tag und spucken diese Daten aus", erklärt Yara. Die Betreiber seien aber gezwungen, diesem riesigen Informationsberg einen Sinn zu geben, sagt er weiter.
Um dieser Art von Datenmengen Herr zu werden, hat sich Greenplum einer Technik bedient, die im Supercomputing schon länger gebräuchlich ist: der massivparallelen Verarbeitung (MPP; Massive Parallel Processing). Dies erlaubt eine Verarbeitung der Informationen über mehrere Server hinweg. "So kann eine Anfrage aufgeteilt und von mehreren Maschinen gleichzeitig angegangen werden", meint Yara.
Die Konkurrenz verwendet laut Yara dagegen einen Hauptrechner, durch den alle Daten müssen, bevor sie von Sub-Systemen verarbeitet werden. "Das kann zu einem Flaschenhals führen, wenn grosse Datenmengen schnell importiert werden müssen", sagt er.
Die Greenplum Data Computing Applance ist ab sofort erhältlich. In einem Rack haben dabei 16 Server Platz mit je zwei Intel-Chips des Typs E5670 à sechs Prozessorkernen. Das Gerät kann als halbes, ganzes oder mehrfaches Rack erstanden werden. Jeder Schrank fasst dabei 36 Terabyte an unkomprimierte Daten. Maximal lassen sich fünf Petabyte komprimierte Daten über 24 Racks hinweg verarbeiten. Ein solches System kann dann bis zu 4608 Datenbank-Cores betreiben.