Cloud Service Management: Zukunftsorientierte Erweiterung des klassischen ITSM

Cloud Service Management and Operations (CSMO) bietet Unternehmen ein Rahmenwerk, um mit Kunden IT- und Cloud-Services zu planen, entwickeln, bereitzustellen, betreiben und zu steuern. Dies hat allerdings zur Folge, dass Unternehmen ihren traditionellen Service-Management-Ansatz überdenken und neu anpassen müssen. Nur so können sie die neuen Anforderungen besser erfüllen und gleichzeitig traditionelle Ansätze wie beispielsweise ITIL beibehalten. Das Rahmenwerk für CSMO definiert bestimmte Rollen, Prozesse und Tools. [1] [2]

CSMO vs. IT Service Management: Was ist anders?

Traditionelles IT-Service Management (beispielsweise nach ITIL) bietet weiterhin wichtige und hilfreiche Ansätze für das Entwickeln und Verwalten von Services. Allerdings muss sich durch die immer weiter voranschreitende Digitalisierung und vor allem der immer größer werdenden Bedeutung von Microservices in Cloud Umgebungen die Arbeitsweise in eine agilere und cloudorientierte Weise entwickeln. Die Praktiken, die beim herkömmlichen IT-Servicemanagement Anwendung finden, bleiben bestehen, aber die Art und Weise wie sie durchgeführt werden, hat sich gewandelt. Dies betrifft auch die Rollen in den Prozessen. Einige bleiben bestehen, andere ändern sich und wieder andere kommen neu hinzu. CSMO bietet diesbezüglich ein festes Rahmenwerk. [1] [3]

Die Bausteine von CSMO

Discovery & Roadmap

Nachdem der aktuelle Ist-Zustand des Unternehmens ermittelt wurde, erstellt der Service Provider in Zusammenarbeit mit dem Kunden eine Roadmap für Prozesse, Integrationen und Transformationspraktiken [1].

CSMO Garage

Die Garage-Methode ist eine Sammlung von Practices und Workflows zur Adaptierung von CSMO. Sie basiert auf Design Thinking und nutzt agile Prinzipien. Zudem dient sie als Katalysator für Continous Delivery, fördert kulturelle Veränderungen und ermöglicht Site Reliablity Engineering. CSMO Garage wird daher beispielsweise verwendet, um in Zusammenarbeit mit Stakeholdern ein Minimum Viable Product (MVP) zu entwickeln [1].

Culture

Die Kultur eines Unternehmens ist ein entscheidender Faktor bei der digitalen Transformation. Sie muss zum einen Teams unterstützen, die geografisch am gleichen Ort arbeiten, aber auch Teams, deren Arbeit nur remote erfolgt. Außerdem werden während der Transformation neue Rollen eingeführt, die zusätzliche kulturelle Veränderungen erfordern [1].

Build to Manage

Da bei Cloud-basierten Anwendungen eine kontinuierliche Bereitstellung von neuen Inhalten unerlässlich ist, müssen sich die Teammitglieder ständig neues Wissen aneignen. Sonst sind sie nicht auf die schnell aufeinander folgenden Bereitstellungen von Inhalten vorbereitet. Der Build-to-Manage-Ansatz bietet Praktiken, die dabei helfen, das erhöhte Maß an Geschwindigkeit zu meistern. Build to Manage soll zusätzlich dazu beitragen, die Zusammenarbeit innerhalb des DevOps-Teams effizienter zu gestalten [1].

RACI

Damit Anwendungen in einer oder mehreren Cloud-Umgebungen betrieben werden können, ist es unerlässlich die Verantwortlichkeiten zwischen Providern und Kunden zu definieren. Mit Hilfe der RACI-Matrix kann übersichtlich festgehalten werden, wer für welche Aufgabe im jeweiligen Prozess zuständig ist [1].

Operational Readiness

Operational Readiness beschreibt den Umstand, dass eine Unternehmung betriebsbereit ist. Um diesen Status zu erreichen, hilft es folgende Fragen zu beantworten:

  1. Was muss sich ändern?
  2. Wie einschneidend ist die Veränderung?
  3. Welche Vorteile ergeben sich dadurch?

Zudem gibt es drei Schritte, die die Bewertung von Operatoinal Readiness erleichtern:

  1. Bestimme, wo du stehst.
  2. Lege fest, welchen Punkt du erreichen möchtest.
  3. Identifiziere Lücken in Prozessen, verbessere diese und bewerte dann erneut (regelmäßig). [1]

ChatOps

ChatOps ist eine Plattform für die Zusammenarbeit von verschiedenen interdisziplinären Teams – unterstützt durch Bots. Sie erleichtert die Kommunikation untereinander und die Zusammenarbeit miteinander. Zusätzlich stellt ChatOps den Teams eine Timeline ihrer vorangegangenen Arbeit und Ideenfindung bereit. Das Ganze wird durch Bots unterstützt [1].

Site Reliability Engineering

Site Reliability Engineering ist eine Disziplin, die eine Verbindung zwischen Entwicklung und Betrieb schaffen soll. Diese Verbindung wird hergestellt, indem bei systemadministrativen Themen eine softwaretechnische Denkweise angewandt wird. Im Zuge des Site Reliability Engineering werden Schwachstellen von Systemen untersucht und deren Belastbarkeit getestet. Dadurch ist es wiederum möglich Optimierungs- und Skalierungsmöglichkeiten zu identifizieren [4].

AIOps

Durch den Einsatz von künstlicher Intelligenz in betrieblichen Prozessen können effizienter vorausschauende Warnungen gegeben- und Ausfälle vermieden werden [1].

5 How’s

Die 5 How’s ist eine Methode, mit der Teams in der Lage sind, die Ursache bestimmter Probleme (im Sinne von ITIL) zu ergründen. Dies geschieht in Zusammenarbeit mit dem gesamten Team. Dabei wird eine erste Frage gestellt, die das Problem darstellt: Warum hatten wir einen Serverausfall? Anschließend wird diese Frage beantwortet (Weil wir einen Stromausfall hatten). Daraufhin wird wiederum nach der Ursache der Antwort der ersten Frage gefragt (Warum hatten wir einen Stromausfall?). Dieser Prozess wird insgesamt fünf Mal durchgeführt und soll dazu führen, die Ursache des Problems zu ergründen [1].

Vorteile des CSMO-Ansatzes

Firmen, die sich dazu entschließen einen CSMO-Ansatz zu verfolgen, können in erster Linie Betriebskosten sparen und ihre Kundenzufriedenheit nachhaltig erhöhen. Dies ist zum einen der Fall, da die Teams durch den Build-to-Manage-Ansatz darauf vorbereitet sind, die immer höher werdende Geschwindigkeit in Projekten zu meistern, und zum anderen, weil die Teams durch AI und ChatOps unterstützt werden. Des Weiteren hilft der Ansatz dabei die eigenen Potentiale für Cloud Computing und DevOps zu ergründen. Zusammenfassend kann man daher sagen, dass CSMO das herkömmliche IT Service Management nicht ersetzen wird, es aber eine gute Möglichkeit bietet, in Zeiten immer schneller voranschreitender Digitalisierung weitere Potentiale voll auszuschöpfen [1].


Quellen

[1] CSMO Field Guide: https://ibm.biz/csmo-field-guide

[2] The cloud adoption playbook: https://www.ibm.com/downloads/cas/KE0VZ04N

[3] IBM: https://www.ibm.com/cloud/architecture/content/course/explore-csmo/itil-csmo/

[4] Dev-Insider: https://www.dev-insider.de/was-ist-site-reliability-engineering-a-980499/