19.02.2008, 08:30 Uhr
Notfallplan für den Server
Disaster Recovery konkret: Wenn ein wichtiger Server ausfällt, gibt es mehrere Möglichkeiten, den Rechner wieder in Gang zu bringen.
Frank Bunn ist Senior Solutions Marketing Manager EMEA bei Symantec.
Tritt eine Katastrophe ein, müssen die Daten auf den betroffenen Firmenservern rekonstruiert werden. Wie schnell und umfassend dieses Disaster Recovery erfolgen kann, hängt von mehreren Faktoren ab: Einerseits vom Budget, das zur Realisierung technischer Massnahmen für eineeffektive Absicherung verfügbar ist. Andererseits muss sich das Wiederherstellungsverfahren an der maximalen Ausfallzeit (RTO = Recovery Time Objective) orientieren, die vergehen darf, bis ein Server wieder in Betrieb sein muss. Die RTO ist abhängig von der Branche, da beispielsweise ein Online-Broker andere Anforderungen an die IT-Verfügbarkeit stellt, als ein Autohändler.
Drei Methoden
Für die Geschwindigkeit, mit der ein ausgefallener Server ersetzt werden kann, ist vor allem die Wiederherstellungsmethode entscheidend. Grundsätzlich besteht die Möglichkeit, einen neuen Server mit Hilfe eines zuvor gesicherten Abbilds einzurichten. Das kann automatisch oder manuell geschehen. Eine weitere, sehr einfache und schnelle, aber auch kostspielige Möglichkeit ist das Betreiben eines zweiten Servers im Stand-by, der per Clustering im Notfall den Betrieb des ausgefallenen Computers übernimmt. Ergänzt werden kann die Server-Wiederherstellung durch Spiegelungs- und Replikationstechnologien, mit denen auch der Datenbestand hochverfügbar wird.
Die automatische Systemwiederherstellung bietet einen grossen Zeitvorteil, weil das Abbild des alten Servers ohne viele Benutzereingriffe schnell rückgesichert und wieder in Betrieb genommen werden kann. Nach dem Start des Vorgangs genügen in der Regel einige wenige Mausklicks, und im Durchschnitt ist der neue Server innerhalb weniger Minuten wieder einsatzbereit. Zudem erfordern automatisierte Vorgänge weniger Vorkenntnisse, sodass im Zweifelsfall auch weniger qualifizierte Mitarbeiter vor Ort ausreichen. Gerade im Fall eines totalen Ausfalls, der das IT-Personal enorm in Anspruch nimmt, könnten so zusätzliche Ressourcen mobilisiert werden.
Das grösste Hindernis bei dieser Art der Wiederherstellung ist bislang die in den meisten Unternehmen vorherrschende heterogene Hardwareumgebung. Wenn nicht zwei vollkommen identische Systeme vorliegen - was eher selten der Fall ist - ist das Abbild des ehemaligen Servers auf einer neuen Hardware zunächst nicht lauffähig.
Dieses Problem tritt bei einer manuellen Wiederherstellung nicht auf, allerdings zu Lasten der Geschwindigkeit. Bei dieser Methode muss das gesamte Serversystem von Grund auf neu installiert und konfiguriert werden - ein aufwändiger, zeitintensiver Prozess, der meist mehrere Stunden dauert und zudem eine hohe Kompetenz beim Administrator voraussetzt. Zwar hilft ein Abbild des alten Servers, den Zustand zu einem bestimmten Zeitpunkt vor der Katastrophe so präzise wie möglich zu rekonstruieren. Aber vor dem Hintergrund immer kürzer werdender RTO ist diese Art der Wiederherstellung nicht mehr zeitgemäss.
Die dritte Möglichkeit, sich gegen Ausfälle abzusichern, ist das Clustering, mit dem per Failover die Serverfunktionen auf einen anderen, dafür bereitstehenden Server übertragen werden und der so die jederzeitige Datenverfügbarkeit gewährleistet. Allerdings verursacht diese Art des Disaster Recovery bei Weitem die höchsten Kosten, da permanent Systeme auf Stand-by zur Verfügung gehalten werden müssen.
Notfall-CD als Rettungsanker
Eine gute und auch preislich attraktive Kombination der verschiedenen Lösungsansätze ist die automatische Wiederherstellung durch Abbilder, die nicht auf ein identisches Serversystem angewiesen sind, sondern auf jeder beliebigen, verfügbaren Hardware durchgeführt werden können. Dies ist zum Beispiel mit dem Einsatz einer Disaster-Recovery-Lösung möglich.
Kern der automatischen und hardwareunabhängigen Wiederherstellung ist eine Notfall-CD mit einer umfangreichen Sammlung generischer Hardwaretreiber. Damit kann auf einem neuen Server zunächst ein funktionsfähiges Windows--System errichtet werden, das alle unverzichtbaren Komponenten wie etwa den Windows-Kernel, Treiber für Festplatten- respektive Raid-Controller und das Plug& Play-System enthält. Auf dieser Basis kann das Abbild des alten Servers rückgesichert werden. Die bereits vorhandene Plug&Play-Fähigkeit des neuen Systems ermöglicht danach die Erkennung und Installation aller zusätzlich nötigen Hardwaretreiber.
Im Ergebnis liegt ein vollständig an die neue Hardware angepasstes Windows-System mit allen Einstellungen und Applikationen des alten Servers vor. Der einzige Benutzer-eingriff, der bei dieser Vorgehensweise nötig werden könnte, ist das Zuführen von Hardwaretreibern, die eventuell nicht im Pool der Notfall-CD enthalten sind.
Um bei einem Systemausfall immer den möglichst letzten Stand wiederherstellen zu können, sollte die Disaster-Recovery-Software entweder nach einem Zeitplan oder durch Ereignisse gesteuert Bilder des kompletten Systems, so genannte Recovery Points, erstellen. Solche Ereignisse können beispielsweise der Einbau neuer Hardware, die Installation neuer Applikationen oder das Ein- respektive Ausloggen wichtiger Mitarbeiter sein.
In der Praxis hat es sich bewährt, ein wöchentliches Voll-Abbild zu erstellen, das von täglichen oder stündlichen inkrementellen Backups ergänzt wird. Das geschieht vor dem Hintergrund, dass komplette Backups des Systems viel Speicherkapazität benötigen und den Server stark belasten. Bei wachsenden Datenmengen und der Notwendigkeit hoher Verfügbarkeit rund um die Uhr bieten inkrementelle Datensicherungen eine gute Ergänzung, da sie weniger Speicherplatz in Anspruch nehmen und darüber hinaus im Hintergrund erstellt werden, ohne Funktionstüchtigkeit und Leistung des Systems zu beeinträchtigen.
Virtuelle Wiederherstellung
Eine weitere interessante Variante beim Disaster Recovery ist der Einsatz virtueller Server, die auf einem physikalischen Server gebündelt werden. So ist gewährleistet, dass sämtliche Server auf denselben Hardware-Ressourcen basieren. Zudem muss nicht für jeden aktiven Server eine eigene Computer-Einheit angeschafft werden. So ist es möglich - je nach Leistungsfähigkeit der Hardware - bis zu 64 virtuelle Server auf einem einzelnen Computer zu platzieren. Je nach Ansatz können Disaster-Recovery-Lösungen Server auch auf einer virtuellen Maschine wiederherstellen. Das bietet den Vorteil, dass im Fall einer Katastrophe nicht einmal ein Computer verfügbar sein muss, solange es noch einen freien virtuellen Slot auf einem bereits existierenden physikalischen Server gibt. Diese Fähigkeit verringert also die Abhängigkeit von Lieferzeiten neuer Hardware und ermöglicht eine schnellere Reaktion im Fall eines Server-Crashs.
Frank Bunn