KI-unterstütztes Application Performance Monitoring – Neuigkeiten zu IBM Instana

Durch die fortschreitende Digitalisierung der letzten fünf Jahre hat die Anzahl der zu überwachenden Software-Applikationen in den IT-Landschaften stark zugenommen. Diese Entwicklung wird sich auch in den nächsten Jahren weiter fortsetzen. Um immer den Überblick über alle Anwendungen und deren Zustand zu haben, bedarf es daher einer umfangreichen und effizienten Überwachung.

Für dieses Application Performance Monitoring (APM) gibt es am Markt verschiedene Anbieter wie beispielsweise Dynatrace oder AppDynamics, welche schon ein recht umfangreiches Monitoring anbieten. Auch IBM verfügt mit Instana über eine umfassende Observability-Lösung, die für komplexe IT-Umgebungen entwickelt wurde und seine Stärken in der Analyse und Fehlerbehebung von containerisierten Anwendungen hat.

Was ist Instana?

Instana ist eine moderne Observability-Plattform von IBM, die Unternehmen dabei unterstützt, die Leistung und Integrität ihrer Software-Anwendungen kontinuierlich zu überwachen und zu optimieren. Die Lösung wurde entwickelt, um die Herausforderungen zu bewältigen, die mit der Überwachung von komplexen, verteilten Systemen, insbesondere Microservices-Architekturen und Cloud-nativen Anwendungen, verbunden sind. Sie wird sowohl On-Premises als auch in Serverless-Architekturen eingesetzt.

Screenshot aus IBM Instana, dass das Dashboard mit mehreren Diagrammen und Performancedaten zeigt.
Abb. 1: Standard-Dashboard für eine Applikation

Durch Full-Stack Observability stellt Instana Transparenz innerhalb einer Applikation her, optimiert Prozesse und bietet der Softwareentwicklung sowie IT-Operations automatisiert ausführbare Aktionen, um auftretende Fehler zu beheben. Anhand der einheitlichen Dashboards können Administratoren und auch Softwareentwickler schnell erkennen, wo sich die Probleme befinden und welche Ursachen diese haben.

Screenshot aus IBM Instana. Neben Menüleisten sieht man mehrere Kreise mit Symbolen und Verbindungslinien, die Abhängigkeiten aufzeigen.
Abb. 2: Automatisierte Darstellung aller Services untereinander

Instana erkennt automatisiert mögliche Probleme von laufenden Anwendungen, erfasst diese übersichtlich und leitet – KI-unterstützt – auch mögliche Lösungsvorschläge an. Damit behält der IT-Betrieb seine entwickelten Lösungen im Blick und kann frühzeitig auf geschäftskritische Einflüsse reagieren.

Welche Neuigkeiten gibt es bei Instana?

2024 ist es IBM gelungen, die WatsonX.ai Plattform für Instana zu integrieren. WatsonX.ai ist eine Plattform von IBM, die auf künstlicher Intelligenz (KI) und maschinellem Lernen (ML) basiert.

Künstliche Intelligenz und maschinelles Lernen treiben im Markt momentan Innovationen und Entwicklungen in fast allen Bereichen der Hardware- und Softwarelandschaft voran. Mit der Integration von WatsonX.ai in Instana halten sie nun auch Einzug und Verwendung im APM. Damit sind für das Leistungsprogramm von Instana neue Features hinzugekommen, wie z. B. Intelligent Remediation.

Was bietet das neue Feature Intelligent Remediation?

Der Begriff Intelligent Remediation bedeutet in direkter Übersetzung ins Deutsche etwa „Intelligente Sanierung“ und ist eine durchaus dienliche Metapher für die Beschreibung des Features. Mit einer intelligenten Sanierung im hausbaulichen Sinne werden ebenfalls mehrere Aspekte mit assoziiert, wie z. B. das Erkennen von Mängeln in einer Struktur, Ursachenforschung mit Rückgriff auf Expertenwissen sowie auch z. B. die fachliche Anleitung, Durchführung und Kontrolle von spezifischen und aufeinander abgestimmten konkreten Einzelmaßnahmen.

Das Intelligent Remediation Feature von Instana bietet u. a.:

  • Automatische Problemerkennung:
    Instana verwendet KI und maschinelles Lernen, um Anomalien in Echtzeit zu erkennen. Die Plattform überwacht kontinuierlich verschiedene Leistungsmetriken und erkennt automatisch Abweichungen von normalen Betriebsbedingungen.
  • Ursachenanalyse und Diagnostik:
    Sobald ein Problem erkannt wird, analysiert Instana die zugrunde liegenden Ursachen. Die Plattform bietet detaillierte Einblicke in die betroffenen Komponenten und identifiziert schnell, wo das Problem liegt.
  • Automatische Problembehebung:
    Die Plattform kann vordefinierte Aktionen ausführen, um erkannte Probleme zu beheben. Dies kann das Neustarten von Diensten, das Skalieren von Ressourcen oder andere Maßnahmen umfassen, die notwendig sind, um die normale Betriebsbereitschaft wiederherzustellen.
  • Proaktive Maßnahmen:
    Instana bietet proaktive Vorschläge an, um zukünftige Probleme zu verhindern. Dies geschieht durch die Analyse historischer Daten und das Erkennen von Mustern, die zu wiederkehrenden Problemen führen können.
  • Integration in andere Tools:
    Instana lässt sich komfortabel in andere DevOps- und Automatisierungstools integrieren, wie z. B. Ansible Automation Platform, um nahtlose Arbeitsabläufe zu ermöglichen und die Effizienz zu steigern.

Use-Case: Proaktive Überwachung und automatische Fehlerbehebung in einer E-Commerce-Anwendung

Hintergrund:

Ein E-Commerce-Anbieter mit einer komplexen Anwendung, die aus mehreren Mikroservices besteht, lässt diese auf verschiedenen Cloud- und On-Premises-Infrastrukturen laufen. Der Anbieter hat festgestellt, dass seine bestehende Überwachung und Fehlerbehebung zu zeitaufwendig werden. Zudem entstehen häufigere und längere Ausfallzeiten, welche die Kundenzufriedenheit – ein kritischer Faktor im E-Commerce – beeinträchtigen.

Ziele:

  • Reduzierung der Ausfallzeiten und schnellere Wiederherstellung bei Störungen
  • Automatisierung der Fehlerbehebung, um menschliche Fehler zu minimieren
  • Verbesserung der Benutzererfahrung durch proaktive Überwachung und sofortige Reaktion auf Probleme

Lösung:

Einsatz von Instana mit Intelligent Remediation zur Überwachung und automatischen Fehlerbehebung.

Schritte:

  1. Implementierung von Instana:
  • Integration: Die E-Commerce-Anwendung wird vollständig in Instana integriert, um eine umfassende Sichtbarkeit aller Mikroservices, ihrer Abhängigkeiten und der zugrunde liegenden Infrastruktur zu gewährleisten.
  • Agenten-Installation: Instana-Agenten werden auf allen relevanten Systemen installiert, um Metriken, Logs und Traces zu sammeln.
Screenshot aus IBM Instana, dass 6 zur Website-Überwachung zeigt. Dargestellt werden Balkendiagramme, Weltkarte und weitere Diagramme bzw. Tabellen.
Abb. 3: Gesamtüberblick einer Webseitenüberwachung

2. Proaktive Überwachung:

  • Echtzeit-Monitoring: Instana überwacht kontinuierlich die Leistungsmetriken, wie Antwortzeiten, Fehlerquoten und Ressourcenauslastung.
  • Anomalie-Erkennung: Die Plattform nutzt maschinelles Lernen, um ungewöhnliche Muster und potenzielle Probleme frühzeitig zu erkennen.
Screenshot aus IBM Instana, dass 6 Diagramme zeigt, die den Zustand von der Infrastruktur überwachen. Gemonitort werden Processing Time, Latency, Calls, Call Rate, Infrastructure Issues / Changes und die Top Services.
Abb. 4: Frühzeitige Anomalieerkennung dank Echtzeit-Monitoring

3. Intelligent Remediation:

  • Automatische Trigger: Bei Erkennung einer Anomalie (z. B. erhöhte Fehlerrate in einem Checkout-Service) aktiviert das Feature automatisch eine vordefinierte Remediation-Strategie.
  • Fehlerbehebungsskripte: Automatische Skripte werden ausgeführt, um häufige Probleme zu beheben, wie z. B. Neustart von Services, Freigabe von Ressourcen oder Durchführung von Rollbacks bei fehlerhaften Deployments.
  • Benachrichtigung und Eskalation: Falls ein Problem nicht automatisch behoben werden kann, wird das IT-Team sofort benachrichtigt und detaillierte Diagnosedaten bereitgestellt.
Screenshot aus IBM Instana, das ein Dashboard mit einem Issue zeigt. Dargestellt ist ein Diagramm der Metriken, die Beschreibung, Dauer und Severity.
Screenshot aus IBM Instana, das ein Dashboard mit einem Issue zeigt. Es wird eine Tabelle der betroffenen Services dargestellt, darunter befindet sich eine weitere Tabelle mit empfohlenen Aktionen.
Abb. 5: Automatisierte Empfehlungen für erkannte Probleme

4. Kontinuierliche Optimierung:

  • Feedback-Schleife: Die Ergebnisse der automatischen Remediation werden überwacht und analysiert, um die Strategien kontinuierlich zu verbessern.
  • Lernende Systeme: Instana passt die Erkennungs- und Behebungsmechanismen basierend auf historischen Daten und neuen Mustern an.

Fazit

Durch den Einsatz von Instana mit Intelligent Remediation konnte der E-Commerce-Anbieter die Ausfallzeiten erheblich reduzieren und die Systemstabilität verbessern. Probleme wurden proaktiv erkannt und in vielen Fällen automatisch behoben, bevor dies für den Endbenutzer spürbar war. Die IT-Teams konnten sich auf strategische Aufgaben konzentrieren, anstatt sich mit ständig auftretenden Störungen auseinanderzusetzen.

Vorteile

  • Geringere Ausfallzeiten: Schnellere Wiederherstellung bei Problemen durch automatisierte Remediation.
  • Verbesserte Effizienz: Weniger manuelle Eingriffe und dadurch geringeres Risiko menschlicher Fehler.
  • Bessere Benutzererfahrung: Höhere Verfügbarkeit und Zuverlässigkeit der E-Commerce-Plattform.
  • Kosteneinsparungen: Effizienterer Einsatz von Ressourcen und Reduzierung der Betriebskosten durch Automatisierung.

Zusammenfassung

Instana ist eine Observability-Plattform, die speziell für die Überwachung von Container-basierten Anwendungen in Cloud-nativen Umgebungen entwickelt wurde.

Dank Intelligent Remediation und der dahinterliegenden generativen KI von watsonx.ai kann Instana automatisch Probleme erkennen und lösen und somit die Betriebseffizienz und Zuverlässigkeit erhöhen.

Die Intelligent Remediation ermöglicht es, komplexe Vorfälle in leicht verständliche Zusammenfassungen darzustellen, die wahrscheinliche Ursache von Vorfällen genau zu identifizieren und Empfehlungen zur effizienten und effektiven Behebung von Problemen zu geben. Darüber hinaus automatisiert Instana die Behebung von Vorfällen basierend auf vordefinierten Richtlinien oder benutzerdefinierten Schwellenwerten, wodurch das Tool die Notwendigkeit manueller Eingriffe reduziert und die Reaktionszeit auf Vorfälle verkürzt. Komplexe IT-Umgebungen sind damit effektiver zu überwachen und zu verwalten.