Backup – aber einfach mit Rubrik

Etablierte Backup- und Recovery-Produkte am Markt haben den Ruf, sehr komplex zu sein, und erfordern damit einen hohen administrativen Aufwand. In vielen Unternehmen gibt es jedoch keine dedizierten Teams mehr dafür und das Backup wird neben vielen anderen Themen mitbetreut. Dadurch entsteht die Anforderung nach möglichst geringem Aufwand. Eine Lösung mit Rubrik kann die Backup-Infrastruktur und das Management stark vereinfachen. Wie dies funktioniert soll dieser Blog Eintrag zeigen.

Probleme in heutigen Backup-Infrastrukturen

In einer klassischen Backup-Infrastruktur gibt es mehrere Komponenten, die zu berücksichtigen sind: Ein eigener Backup Server mit Betriebssystem, Backup Storage, Tape Libraries, im Virtualisierungsumfeld Proxy-Systeme für das Backup von virtuellen Maschinen und – je nach Software –  eigene Hosts, die den Part der Deduplizierung übernehmen und die Dedup-Metadaten vorhalten. So entstehen im Lebenszyklus einer Backup-Infrastruktur einzelne Silos, die sich nicht in einer Oberfläche bedienen lassen, und es müssen Produkte verschiedener Hersteller gepflegt werden.

Bedingt durch diese Komplexität erfordert das Management einer solchen Lösung einen hohen Aufwand. Das Betrifft sowohl Updates auf Betriebssystem-Ebene, Patches oder neue Major Releases der verwendeten Backup Software als auch die Firmware des verwendeten Backup Storages oder der Tape Libraries. Im Gesamtkonstrukt muss immer zwingend die jeweilige Supportmatrix für Soft- und Hardware berücksichtigt werden. Im schlimmsten Fall muss für den Support ein Ticket bei mehreren Herstellern erstellt und die Zusammenarbeit koordiniert werden.

Der Backup Server stellt in vielen Umgebungen einen ‚Single Point Of Failure‘ dar. Abhilfe kann hier geschaffen werden, wenn die Lösung mit Betriebssystem-Bordmitteln oder einer anderen, von der Backup Software unterstützten, Cluster Software hochverfügbar abgebildet wird. Dadurch steigt aber auch erneut die Komplexität der Lösung und es ist weiteres Wissen über die Cluster Software notwendig.

Hinzu kommt, dass sich dynamisches Wachstum, egal ob in Richtung Performance oder Kapazität, nur sehr schwer abfangen lässt. Wird mehr Performance benötigt, hilft häufig nur der Umstieg auf schnellere Hardware und im Falle des Backup Servers müssen die Daten migriert werden. Wird es bei der nutzbaren Kapazität eng, ist die Anzahl der Platten-Shelves ausschlaggebend, die noch an den Controller der Storage Lösungen angeschlossen werden kann. Ist das Limit erreicht, kann nur noch ein weiteres System parallel aufgebaut und in der Backup Software als zusätzliches Speichermedium konfiguriert werden.

Außerdem kann auch ein Hardware-Austausch des Backup Servers oder des Backup Storage am Ende des Lebenszyklus ein langwieriger und fehleranfälliger Prozess sein. Der Austausch des Backup Servers gestaltet sich dabei am Einfachsten: Die verwendete Software wird auf einem neuen Host installiert und anschließend eine komplette Wiederherstellung der Konfiguration und Kataloge aus einem Disaster Recovery Backup durchgeführt. Alternativ können auch alle notwendigen Datenbanken und Konfigurationsdateien vom alten auf den neuen Host kopiert und eingebunden werden. Zu berücksichtigen ist bei dieser Methode eine Downtime, die notwendig ist für einen konsistenten Zustand auf dem neuen System. Beim Backup Storage muss aber gewährleistet werden, dass wirklich alle Daten auf die neuen Systeme übertragen werden und dort auch verfügbar sind. Unserer Erfahrung nach ist dieser Prozess nicht immer einfach und performant und hinterlässt einen bitteren Beigeschmack, wenn in den Logdateien kryptische Fehlermeldungen auftauchen, die Migration aber als erfolgreich abgeschlossen gilt. Einen Knopf, der all diese Dinge automatisiert durchführt und am Ende auch überprüft, gibt es leider nicht.

Backup mit Rubrik – eine konvergente Lösung

Bei Rubrik kommt alles aus einem Guss in Form einer Appliance bestehend aus einer dedizierten Hardware und einem homogenen Software Stack. Wichtige Ziele von Rubrik sind, sehr einfach bedienbar zu sein und eine schnelle Orientierung in der Benutzeroberfläche zu ermöglichen. Daraus resultiert ein geringer Schulungsaufwand mit kurzer Einarbeitungszeit. Ein weiteres wesentliches Merkmal ist die gute Skalierbarkeit der Lösung in Richtung Performance und Kapazität.

Die Grundlage für die Skalier- und Verfügbarkeit bildet ein neu entwickeltes Filesystem nach dem Web-Scale-Ansatz. Ein besonderes Feature ist, dass sowohl die Backupdaten als auch die Metadaten über alle Knoten hinweg im Filesystem gehalten werden. Die Backupdaten werden dort als unveränderbar abgelegt, sobald sie geschrieben wurden. Dadurch, und durch den Fakt dass auf die Daten nicht von außerhalb mit Hilfe von CIFS/NFS oder anderer Protokolle zugegriffen werden kann, sind sie vor Ransomware-Attacken geschützt.

Die Rubrik Appliance besteht aus mehreren Knoten für die Rechenleistung und den einzelnen Knoten sind Festplatten für die Daten zugeordnet.  Immer kommen, je nach Modell, auf zwei Höheneinheiten im Rack vier Knoten mit jeweils drei HDD- und SSD-Festplatten. Alle Knoten werden zu einem Cluster zusammengefasst, der beliebig wachsen kann, der Kapazität sind somit keine Grenzen gesetzt. Sollte mehr Rechenleistung oder Kapazität notwendig werden, kann das System im laufenden Betrieb erweitert werden. Bedingt durch diese Architektur eignet sich Rubrik auch für Enterprise Umgebungen im Petabyte Bereich. Alle Komponenten von Rubrik sind auf alle Knoten verteilt und darüber auch ansprechbar, die Komplexität, die eine Cluster Software mitbringt, entfällt also komplett. Sollte ein Knoten innerhalb des Clusters ausfallen, übernimmt ein anderer Knoten dessen Arbeit. Dank Erasure Coding (EC) werden die Backupdaten über alle Knoten und deren Festplatten im Cluster hinweg verteilt und sind somit ebenfalls beim Ausfall eines oder mehrerer Knoten weiterhin verfügbar.

Rubrik ist komplett software-defined und läuft auf Standard Intel x86 Hardware. Neben der von Rubrik verwendeten Appliance lassen sich auch zertifizierte Modelle namhafter Hersteller wie Dell, Cisco oder HPE nutzen. Parallel zu den hardwarebasierten Angeboten kann Rubrik auch in einer virtuellen Umgebung und in der Cloud ausgerollt werden. Steht ein Hardwareaustausch an (neue Modelle der Knoten, Lebenszyklus), können die Knoten der neueren Generation einem bestehenden Cluster hinzugefügt werden. Die abzulösenden Knoten werden danach evakuiert. D.h. die abgelegten Daten werden im Hintergrund automatisch auf die neuen Knoten migriert. Ist der Prozess abgeschlossen, können die alten Knoten aus dem Cluster entfernt und die Hardware abgebaut werden. 

Um dem Ausfall eines Standorts oder Rechenzentrums vorzubeugen, lassen sich die Daten auf einen anderen Rubrik Cluster replizieren und sind dann nach Abschluss der Replikation sofort am anderen Standort im Zugriff. Für eine Langzeitaufbewahrung ist es möglich die Daten auf einen NFS oder S3 kompatiblen Storage zu verdrängen. Die Metadaten bleiben dann im Cluster vorhanden, um alle Funktionen – beispielsweise bei einem Restore – weiterhin zur Verfügung stellen zu können.

Neben den gängigsten Anwendungen On Premise ist eine Unterstützung der Cloud bereits in die Lösungen integriert. Dabei ist  nicht relevant, ob die Daten nur für eine Langzeitaufbewahrung in der Cloud gespeichert werden sollen, oder aber die Applikationen, die in der Cloud laufen, gesichert werden sollen. Zudem ist es für Disaster-Recovery-Zwecke möglich, beispielsweise VMware-Daten bei einer Replikation in die Cloud direkt in das jeweilige native Format des Anbieters umzuwandeln, um die Maschinen bei Bedarf direkt in der Cloud starten zu können.

Die Benutzeroberfläche ist komplett in HTML5 geschrieben und bildet die zentrale Anlaufstelle von Rubrik –  unabhängig davon, ob es um die Konfiguration eines Backups geht, das Starten eines Restores oder das Erstellen von Reports. Die Benutzeroberfläche selbst nutzt im Hintergrund immer die REST-API-Schnittstelle von Rubrik. Das bedeutet, dass ein sehr hoher Automatisierungsgrad erreicht werden kann und Rubrik beispielsweise in vorhandene Tools wie Puppet, Ansible oder in ein Ticketsystem eingebunden werden können. Für Rubrik gibt es bereits fertige Module für die Skriptsprache der Wahl, beispielsweise PowerShell oder Python. Weitere Informationen dazu und zu fertigen Modulen finden Sie auf Rubrik Build: https://build.rubrik.com/.

Rubrik Cloud Data Management

Rubrik wurde im Januar 2014 gegründet und die erste Version des Produkts kam Ende 2014 auf den Markt. Dieses ermöglicht mit Cloud Data Management das Sichern, Verwalten und Wiederherstellen von Daten. Überall – Jederzeit.

Anfangs stark spezialisiert auf das Backup von VMware-Umgebungen und die Auslagerung in die Cloud, ist Rubrik Ende 2019 bei der Version 5.1 mit einer breiten Unterstützung von Applikationen angelangt.

Eines der Ziele von Rubrik ist es, die Backupdaten schneller innerhalb des Clusters zur Verfügung zu stellen und dadurch eine sehr geringe RTO-Zeit zu erreichen. Mit Hilfe von Live Mounts können die Backupdaten fast aller Applikationen direkt aus dem Cluster heraus einem Host zur Verfügung gestellt werden. Um Objekte zu schützen, können bereits definierte SLAs im Unternehmen in Rubrik übernommen werden. In den SLAs wird festgelegt, wie häufig ein Backup des Objekts erstellt wird, die Aufbewahrungszeit sowie die Replikation auf einen anderen Cluster oder die Archivierung auf einen per NFS/S3 kompatiblen Storage oder in die Cloud (AWS, Azure, Google). SLAs in Rubrik sind nicht auf einen bestimmten Objekttyp begrenzt, es lassen sich beispielsweise virtuelle Maschinen und Datenbanken in einer SLA schützen. Das hat zur Folge, dass wenige SLAs (< 10) ausreichen, um Kundenumgebungen mit SLA Policies auszustatten, selbst wenn diese aus verschiedensten Applikationen bestehen. Die Mandantenfähigkeit erlaubt es, Organisationsstrukturen in Rubrik abzubilden und darauf aufbauend ein Self-Service-Portal für die Benutzer zur Verfügung zu stellen.

Als zentrales Management für eine verteilte Rubrik-Umgebung kommt Polaris zum Einsatz. Polaris ist eine gänzlich neue Möglichkeit, das Daten-Management über offene APIs zu steuern. Apps im Marketplace, basierend auf Polaris, adressieren Datenkontrolle, Policies, Informationssteuerung, Datenklassifizierung, Datensicherheit und Daten-Intelligenz. Ein bereits verfügbares Beispiel ist Radar. Radar ermöglicht es, Anomalien im Backup durch eine KI festzustellen und damit mögliche Ransomwareattacken frühzeitig zu identifizieren. Wird eine Anomalie erkannt, ist es mit Radar möglich, mit wenigen Klicks die geänderten Dateien anzuzeigen und auch wiederherzustellen. Dabei werden ausschließlich die betroffenen Dateien wiederhergestellt.