Next-Gen Backup

Disaster Recovery, Next-Gen Backup

Backup und Disaster Recovery (DR) sind zwei sehr wichtige Aspekte, wenn Unternehmen hyperkonvergente IT-Infrastrukturen (HCI) implementieren. In dieser Blog-Serie möchte ich gerne einige meiner Erfahrungen während meiner Arbeit als Architekt und Berater teilen. Die Serie konzentriert sich hauptsächlich auf hyperkonvergente Umgebungen auf Basis von NUTANIX zusammen mit den entsprechenden Hypervisoren VMware, Hyper-V und AHV. Sowie auf Konzepte, die bei der Planung von Backups und Disaster Recovery für diese Infrastrukturen zu berücksichtigen sind.

Die Welt des “next-gen backup”

In den letzten fünf Jahren haben sich die Technologien in der IT-Branche so schnell verändert wie nie zuvor. Dies gilt auch im Bereich von Infrastruktur in Rechenzentren. Da Virtualisierung weiter an Bedeutung zunimmt und die geschäftlichen Anforderungen immer mehr Agilität und Flexibilität erfordern, stoßen viele der klassischen Multi-Tier-Architekturen an ihre Grenzen. Konvergente, Hyperkonvergente und Cloud-Architekturen werden immer häufiger.

In dieser sich ständig verändernden virtualisierten IT-Welt sind unterschiedliche Ansätze für Backup und Disaster Recovery erforderlich. Viele Unternehmen definierten ihre Backup- und DR-Prozesse für die “alte Welt”.

Diese Prozesse und Konzepte können oft nicht mit einer hochgradig virtualisierten und flexiblen IT-Infrastruktur Schritt halten, welche auf Hyperkonvergenten- oder Cloud-Technologien basiert. Darüber hinaus ist es oft erforderlich, sehr niedrige RPO/RTO-Zeiten zu gewährleisten (vgl. Definition von RPO/RTO).

Moderne DR und Backup-Tools konzentrieren sich bereits auf diese neuen Anforderungen und das Feature-Set bietet bestmögliche Integration in hyperkonvergente und Cloud Infrastrukturen.

Teil 1: Generelle Betrachtungen für Backup und DR in einer hyperkonvergenten IT Infrastruktur

Ein Backup- und/oder Disaster Recovery-Konzept für eine hyperkonvergente Infrastruktur, unterscheidet sich in vielen Aspekten und Anforderungen von klassischen 3-Tier Umgebungen.

Einige dieser Aspekte und Anforderungen sind:

„alles software definiert“ (Compute, Storage, Netzwerk)

  • Sehr hohes Konsolidierungsverhältnis von Anwendungen.
  • Viele verschiedene Workloads
  • Unterschiedliche Hypervisoren
  • Container-Technologien
  • Spezifische API- und Programmierschnittstellen
  • Stark segmentierte Netzwerke mit hoher Komplexität
  • Sehr große Skalierbarkeit

Warum ist dies wichtig?

Zunächst einmal ist es sehr wichtig, immer „das große Ganze“ im Auge zu behalten. Backup- und DR-Prozesse müssen an den Geschäftsanforderungen und den daraus resultierenden technischen Anforderungen ausgerichtet sein.

Darüber hinaus ist es wichtig, zu verstehen wie hyperkonvergente Infrastrukturen diese Prozesse verändern oder beeinflussen. Dies kann in der ersten Phase eine komplexe Aufgabe sein. Je besser und detaillierter jedoch auf die geschäftlichen Anforderungen hingewiesen wird und das Konzept an den technischen Anforderungen ausgerichtet ist, desto besser werden die implementierten Tools und Abläufe dazu passen.

Im Folgenden sind nun ein paar Fragestellungen zu geschäftlichen und technischen Anforderungen aufgeführt. Diese gilt es, zu adressieren und zu erörtern.

  • Welche Benutzer oder Benutzergruppen werden die neue HCI-Umgebung nutzen? 
    • Es sollten alle oder so viele wie möglich identifiziert werden.
  • Kenntnisse der „Stakeholder“ über HCI-Systeme?
  • Können alle Anwendungsbetreuer ihre Backup- und DR-Anforderungen definieren?
    • Dies ist ein sehr wichtiger Punkt. Denn die Applikation steht oftmals im Fokus der Abteilungen eines Unternehmens.
  • Wer definiert Backup- und DR-Anforderungen innerhalb des Unternehmens?
  • Verantwortlichkeiten, Personen, Abläufe
  • Sind RPO/RTO bereits definiert?
  • Sind bestehende Backup- und DR-Dokumente verfügbar?
  • Sind SLA’s bereits definiert?
  • Wer ist für die Dokumentation verantwortlich?
  • Besteht Zugriff auf die Dokumente?
  • Strategische Business-Treiber für die Hyperkonvergente Infrastruktur
  • Gibt es Einschränkungen oder Annahmen, welche im Konzept bedacht werden müssen?

Definition von RPO/RTO und SLA

RPO/RTO sowie SLA-Definitionen sind sehr wichtige Aspekte, welche bei der Planung von Backup und DR-Prozessen zu berücksichtigen sind. Ich möchte im Folgenden die Bedeutung dieser drei Begriffe näher erläutern:

RTO:
Das Recovery Time Objective (RTO) ist die Zeit, die nach einem Absturz eines Computers oder einer Anwendung oder nach einer Netzwerkunterbrechung vergeht, bis das System den normalen Betrieb fortsetzen und den Zugriff auf die Daten ermöglichen kann. Der RTO-Wert wird in einer Zeiteinheit – in Sekunden, Minuten, Stunden oder Tagen – angegeben.

RPO:
Das Recovery Point Objective (RPO) ist der Wiederherstellungszeitpunkt nach einem Ausfall eines IT-Systems oder der IT-Infrastruktur. Es bleibt in direkter Abhängigkeit vom Recovery Time Object (RTO).

SLA:
Ein Service Level Agreement (SLA) ist ein Vertrag zwischen einem Service-Provider und einem Kunden. Im Vertrag ist in der Regel festgehalten, in welchem Umfang die Dienstleistung und zu welcher Dienstgüte (Servicelevel) sie erbracht wird. Viele Internet Service Provider (ISP) bieten ihren Kunden einen SLA. IT-Abteilungen in großen Unternehmen setzen oft ebenfalls Service Level Agreements auf, um die Dienstleistungen für Kunden (die Nutzer in den Abteilungen des Unternehmens) transparenter zu machen. So können diese Leistungen einerseits gerechtfertigt und gemessen werden. Andererseits lassen sie sich so mit externen Angeboten vergleichen.

SLAs können folgende Definitionen beinhalten:

  • Die prozentuale Verfügbarkeit der Services
  • Die Anzahl der User, die gleichzeitig bedient werden können
  • Performance-Benchmarks zum regelmäßigen Vergleich mit aktuellen Werten
  • Den Zeitrahmen für die vorzeitige Benachrichtigung bei eventueller Service-Einschränkung
  • Die Reaktionszeit des Helpdesks für verschiedene klassifizierte Probleme
  • Die Verfügbarkeit des Zugangs
  • Die Bereitstellung von Nutzungsstatistiken

Ein Backup- und DR-Konzept sollte primär an diesen Vorgaben ausgerichtet sein, um die geschäftlichen Abläufe bestmöglich zu unterstützen.

Fazit

Ein fundiert ausgearbeitetes Backup- und DR-Konzept ist unerlässlich für die Unterstützung der Verfügbarkeit von Kernanwendungen in einem Unternehmen. Auch in der neuen “Cloud”-basierten Welt.

Im 2.ten Teil der Artikelreihe geht es um die technischen Funktionen und Features der NUTANIX Plattform und wie diese im Rahmen des Backups und DR Konzeptes genutzt werden können.

War dieser Artikel für dich interessant?