EMC 21.04.2010, 13:48 Uhr

12,8 TeraByte in 60 Minuten

Anfang Mai bringt EMC eine neue Enterprise Backup-Lösung auf den Markt - einen wahren Deduplizierungs-Turbo, wie das Unternehmen behauptet.
Das Data Domain Global Deduplication Array (GDA) erledigt bis zu 270 Backup-Aufträge gleichzeitig, mit einem Datendurchsatz von bis zu 12,8 Terabyte pro Stunde. Mit dieser Performance zieht das GDA zum Beispiel ein Backup von 100 Terabyte in weniger als acht Stunden durch und ist damit, laut EMC, das schnellste Inline-Deduplizierungssystem auf dem Markt. Insgesamt lassen sich mit der Lösung 14,2 Petabyte logische Daten, also echte Backup-Daten plus Pointer, sichern.
Grosse Zahlen, hohe Performance - möglich macht das EMCs Deduplizierungstechnik, welche die zu sichernden Daten nur einmal abspeichert. Die Lösung sichert nicht fixe Blöcke, sondern variable, zwischen vier und zwölf Kilobyte grosse Segmente. Auf diese Weise gelingt es, sehr feinteilig nur diejenigen Segmente abzuspeichern, die sich seit dem letzten Backup-Vorgang verändert haben.
Summenvektor bringt Tempo
Ein üblicher Deduplizierungsfaktor von 10 reduziert den Speicherbedarf um 90 Prozent. Technisch funktioniert das so: Eine In-Memory-Datenstruktur des Data Domain OS, der Summenvektor (Summary Vector), merkt sich bereits gesicherte Segmente des aktuellen Backup-Laufes. Zusätzlich werden On-Disk-Indizes alter Backups während des Boot-Vorgangs des Data-Domain-Betriebssystems in den Hauptspeicher geladen. Der Summenvektor, ein Array mit Hash-Werten, enthält damit den Index sämtlicher Backup-Segmente, die auf der GDA gepeichert sind. Er ist zudem nur einige MegaByte gross. «Dadurch lassen sich die Performance-Vorteile von Mehrkern-Prozessoren sehr gut für die Datensicherung nutzen», betont Ditmar Klausmann von EMC. Zugriffe auf Festplattenmedien, die mehr Zeit kosten als der Griff in den Hauptspeicher, erübrigen sich weitgehend.
Ob Deduplizierung auf dem Client oder auf dem Backup-Server stattfinde, ist für Klausmann eine Frage der Philosophie. Die Multi-Controller-Struktur des neuen GDA verbindet ausserdem über einen Namespace jeweils zwei DD880-Controller, was Load-Balancing und Backup-Policies erleichtert.



Das könnte Sie auch interessieren