Desaster Recovery in der Cloud: Daten sind nur die halbe Geschichte 

Die Cloud als Ziel: Es gibt nur wenige Unternehmen, in denen nicht darüber nachgedacht wird, einzelne Dienste in die Cloud zu verlagern. Besonders beliebt als erster Schritt ist es, die Backup-/ Desaster-Recovery-Strategie auf die Cloud auszuweiten.  

Für viele Unternehmen ist der Schritt zu Cloud-Speicher für Backup-Kopien denkbar einfach. Damit entfallen sowohl Komplexität als auch Kosten, da für die Kopie keine Hardware mehr benötigt wird. Außerdem verspricht die Cloud einen so gut wie unlimitierten Speicher. Dementsprechend bieten schon viele Backup-Lösungen auf dem Markt direkte Schnittstellen in ihrer Software für Cloud. Folglich werden täglich Backupdaten auf Azure Blob Storages und AWS S3 Speicher verschoben und liegen dort glücklich und zufrieden bis an Ihr Retentionsende.  

So weit, so gut. Die Cloud als logical Air-Gap zu nutzen und dabei Kopien von Backups zu erstellen oder Sie als Long-Term-Retention/Archive von Backup Dateien zu nutzen, ist erstmal eine gute Sache. Reicht das aber im Fall eines Desasters? Viel zu oft fällt dazu dieser Satz auf: 

„Hauptsache wir haben die Daten. Im Desaster-Fall werden wir die VMs einfach in der Cloud starten.“ Schön wäre es. Die Realität ist allerdings komplexer.

Desaster Recovery Plan: Wer braucht sowas? 

Die Nutzung der Cloud für die Speicherung von Kopien der Sicherungsdaten ist in vielen Situationen eine gute Idee. Allerdings sollte eines vorneweg sehr klar sein: 

Backups sind kein Desaster Recovery Plan! 

Aber was ist dann ein Desaster Recovery Plan? Vereinfacht erklärt ist ein Desaster Recovery Plan (Notfallwiederherstellungsplan) ein dokumentierter Prozess, der beschreibt, wie eine Organisation auf definierte Katastrophenfälle reagieren sollte, um so schnell wie möglich wieder produktiv zu werden. Und brauchen wir eigentlich einen Prozess dafür oder geht es auch ohne? Schauen wir uns diese Vorgehensweise mal anhand eines kleinen Beispiels an: 

Stellen wir uns mal vor, die On-Premises-Infrastruktur wäre ein Schloss aus Bausteinen.

Lego Bausatz - Darstellung der Burg Hogwarts Nahaufnahme
Lego Bausatz – Darstellung einer Burg

Jeder Stein ist dabei ein anderer Datensatz. Wenn alle Daten richtig zusammengesetzt sind, sehen die zusammengesetzten Steine am Ende aus wie ein Schloss. Was aber passiert nun, wenn all diese Daten in die Cloud kopiert werden?

Lego Bausteinkiste - halb geschlossen
Lego Bausteinkiste – halb geschlossen

Man erhält eine große Kiste voller Daten-Steine. Sie sind unsortiert und liegen in allen nur erdenklichen Arten und Farben vor. Alles sieht geordnet aus und alle Teile sind vorhanden. Nimmt man jetzt an, dass das Schlimmste eingetreten ist und diese Backups müssen verwendet werden, um alles wiederherzustellen.

Lego Bausatz - Turmspitze
Lego Bausatz – Turmspitze

Jetzt stellt sich die Frage, wie gut man das Infrastrukturbild im Kopf hat. Manche Teile sind leicht zu identifizieren und damit schnell wieder zusammengesetzt. Allein aus dem Kopf heraus, eines ganzen Schlosses zusammenzubauen, ist allerdings beinahe unmöglich. Ganz zu schweigen von der Tatsache, dass im Desaster-Fall Druck von allen Seiten herrscht, alles so schnell wie möglich wieder zum Laufen zu bekommen. 

Lego Bausatz – Beschreibung

Und genau hier kommt der Desaster-Recovery-Plan ins Spiel: Ein Handbuch mit all den notwendigen Schritten für den Wiederaufbau der Umgebung. Wenn der Cloud ein Teil dieser Notlösung sein soll, ist es wichtig, die notwendigen Komponenten zu erkennen und die richtigen Vorbereitungen zu treffen, um sie erfolgreich einzusetzen.

Daten in der Cloud – was braucht man mehr?

Was ist dann für einen sicheren Desaster-Recovery-Plan notwendig? Es wurde schon festgestellt, dass Backup-Dateien allein nicht reichen, um ein Desaster zu überwinden. Was gehört noch zum Plan dazu? Lassen Sie uns die wichtigsten Punkte anschauen: 

Die richtigen Daten

Auch wenn Daten allein nicht alles retten können, sind sie immer noch die wichtigste Komponente einer erfolgreichen Wiederherstellung. Es geht vielmehr darum, die richtigen Daten zu nutzen. Wird eine Archivierungsmethode angewandt, um ältere Daten in die Cloud zu verschieben? Wenn die Backups erst nach X Tagen in die Cloud verschoben werden, dann ist der Zustand der Daten im Desaster-Fall X Tage alt. Wenn das Unternehmen aber keinen Datenverlust von X Tagen verkraften kann, ist diese Archivierungsebene kein Teil eines guten Desaster-Recovery-Plans.

Viel geeigneter ist in diesem Fall eine zeitnahe Kopie der Backup-Daten in der Cloud. Dieses Vorgehen kann als Ersatz oder parallel zu einer Archivlösung angewandt werden. Restore Point Objectives (RPOs) von einem Tag oder sogar weniger sind durchaus realisierbar und stellen eine viel bessere Basis für ein Recovery der Infrastruktur im Desaster-Fall dar. 

Die richtige Umgebung

Gibt es in der Umgebung Anwendungen, die voneinander isoliert werden müssen, z.B. Prod, QA und Dev? Gibt es Verbindungen zu anderen Standorten und wie sieht es mit der DNS-Auflösung aus? Wird eine Anbindung an ein Software-Defined WAN benötigt? Kurzum: Alles, was im Datacenter benötigt wird, um die eigenen Services bereitzustellen, ist weiterhin in der Cloud nötig. Wie kommt man dann dort dran? Die Lösung ist eine Landing-Zone. 

„Kranplätze müssen verdichtet sein!“.

So wie auf einer Baustelle ist es auch mit einer Cloud-Landing-Zone. Eine Landing-Zone ist ein sicheres Fundament in der Cloud. Nur mit der richtigen Infrastruktur ist ein Betrieb von Services dort möglich. Ein Landing-Zone beinhaltet Netzwerkkonzepte, Berechtigungsstrukturen, Ressourcen, Monitoring, Security, und vieles mehr. Im Grunde alles, was schon vor Ort im Rechenzentrum vorhanden ist. Die Implementierung sollte gut dokumentiert, verstanden und überwacht werden, damit sie bereit ist, wenn sie benötigt wird.

Das richtige Know-how

Die Daten sind vorhanden, eine Landing-Zone schon etabliert. Aber wie werden sich die Mitarbeitenden mit diesen wiederhergestellten Diensten verbinden? Wie sieht es mit Mitarbeitenden aus, die plötzlich ihren gewohnten Arbeitsplatz verlassen müssen? Wie werden sie zu den Ressourcen gelangen, die sie für die Fortsetzung ihrer Arbeit benötigen und wie werden sie sich authentifizieren? 

Ein gut konzipierte Landing-Zone hilft auch hier, indem die benötige technische Ressourcen, wie VPN-Server, Directory Services und MFA inkludiert sind. Es ist aber genauso wichtig, die End-User (und End-Geräte) vorzubereiten. Diese Vorbereitung umfasst Dokumentationen, Schulungen und gegebenenfalls Client-Software oder Hardware. Dabei sollten auch die Administratoren nicht vergessen werden. Wenn diese nicht auf die Arbeit mit der Cloud vorbereitet sind, werden sie im Falle einer Katastrophe nicht helfen können.

Geht das auch kürzer?

Natürlich! Was wirklich gebraucht wird, ist eine Strategie, einen Plan wie diesen umzusetzen und die Gewissheit, dass sich dieser umsetzen lässt. Was wird dafür benötigt?

  1. Die richtigen Daten
  2. Eine Landing-Zone
  3. Vorbereitete Mitarbeitende

Damit sind die wichtigen ersten Schritte gemacht, die Cloud in die Desaster-Recovery Planung miteinzubeziehen. Dieser Artikel wirft zwar viele Fragen auf, gibt dazu aber ein paar Hinweise zur Lösung. Diese weisen nur den Weg, denn es gibt keine „Einheitslösung“ für alle Fälle. Zum Abschluss stellen wir Ihnen die wichtigste alle Fragen: Wie sieht ihr Desaster Recovery Plan aus?