Amazon
29.04.2011, 10:17 Uhr
Datenverlust durch EC2-Crash
Amazon hat eingeräumt, dass beim Ausfall von Teilen seiner Cloud-Infrastruktur einige Daten für immer verlorengegangen sind.
Vor allem am Gründonnerstag und Karfreitag gingen allerlei Kunden von Amazons Cloud-Servcie EC2 zwangsweise vom Netz - darunter etwa die Webfirmen Foursquare, Reddit und Quora. Verantwortlich dafür war, dass bei Amazon Web Services (AWS) unter anderem Datenbankinstanzen ausgefallen waren. Die Amazon-Panne war der bislang grösste Ausfall bei einem Cloud-Anbieter und vor allem deswegen besonders bedenklich, weil sie mehrere eigentlich voneinander isolierte «Availability Zones» betraf. Eine detaillierte Analyse und Bewertung liefert Thorsten von Eicken, CTO des Cloud-Management-Spezialisten Rightscale, im Blog des Anbieters. Von Eicken kritisiert unter anderem die Salamitaktik von Amazon bei der Informationspolitik gegenüber den betroffenen AWS-Kunden. Bislang hat Amazon noch keine schlüssige Erklärung zur Ursache des Ausfalls abgegeben, und auch im Blog «All Things Distributed» von Amazon-CTO Werner Vogels herrscht bis dato Funkstille zu der prekären Panne. Amazon schreibt in den AWS-Statusmeldungen jedenfalls, dass die Systeme inzwischen wieder weitgehend funktionieren und später eine detaillierte Analyse des Ausfalls veröffentlicht werden soll.
Daten futsch
Klar ist, dass Amazon nach dem Crash nicht alle Daten retten konnte. Dies geht aus einer E-Mail hervor, die der Cloud-Riese an einen grossen Kunden versendet hat. Der Branchendienst «Business Insider» hat die betreffende E-Mail-Nachricht publiziert. Amazons Versuche, die Daten manuell wiederherzustellen, scheiterten offenbar allesamt. Welche Firmen genau betroffen sind, ist noch nicht bekannt. In dem «Business Insider»-Bericht beklagt Henry Blodget, dass Amazon (so wie andere Cloud-Anbieter auch) seine Kunden mit dem Versprechen regelmässiger Backups in falscher Sicherheit wiege. Oft würden die zu sichernden Dateien bei genauerem Hinsehen nur irgendwo auf dem gleichen Server oder im gleichen Server-Raum kopiert - mit einer echten Disaster-Recovery-Strategie habe das wenig gemein, meint der frühere Wall-Street-Analyst.