S3-kompatibler Objektspeicher für KI-Datenanalyse im Gesundheitswesen 

In Zeiten wachsender Datenmengen stehen Unternehmen vor einer zentralen Herausforderung: Wie lassen sich große, heterogene Datenbestände sinnvoll strukturieren und nutzbar machen? Besonders im Gesundheitswesen, wo Daten aus verschiedenen Quellen wie PACS, KIS oder Arztbriefen zusammenlaufen, ist eine intelligente Datenorganisation entscheidend. Hier setzen Cloudian, SVA und Averbis mit einer gemeinsamen Lösung an, die Speichertechnologie und KI-basierte Analyse vereint. 

Cloudian HyperStore: Skalierbarer Speicher für komplexe Anforderungen 

Cloudian bietet mit HyperStore eine umfassende Software-definierte Speicherlösung an, die als S3-kompatibter Objektspeicher skaliert und sowohl On-Premise als auch Hybrid-Cloud-Umgebungen unterstützt. Unternehmen profitieren von der Möglichkeit, große Datenmengen kostengünstig und flexibel zu speichern und zu verwalten. 

Dies ist besonders relevant, wenn riesige Datenbestände für KI-Anwendungen aufbereitet oder durchsucht werden müssen. Dabei spielen die Klassifizierung und korrekte Attributierung der einzelnen Datenobjekte eine entscheidende Rolle. 

Intelligente Datenklassifikation mit KI 

SVA hat in Zusammenarbeit mit Cloudian und Averbis eine maßgeschneiderte Lösungs-Suite entwickelt, um diese Datenherausforderungen im Gesundheitswesen optimal zu adressieren. In einem typischen Anwendungsfall werden Gesundheitsdaten aus unterschiedlichen Systemen wie PACS oder KIS in einem S3-Bucket gesammelt. Jedes dieser Datenobjekte wird automatisch an die KI-Plattform „Health Discovery“ von Averbis übermittelt. Diese Plattform analysiert und bestimmt den Dokumententyp sowie die Datenschutzklasse. 

Anatomie eines S3-Objekts – Strukturierte Speicherung medizinischer Bilddaten am Beispiel eines Röntgenbildes

  • BLOB
    • Bilddatei gespeichert als jpg/dicom oder dergleichen 
  • System Metadaten:​ ​ 
    • Bucket – Name des „Eimers“ (z.B. „healthdata“​) 
    • Key – Schlüssel oder Object-ID (z.B. „xray47110815“​) 
    • Date – Datum der Erstellung des Objekts​ 
    • Content-Length – Größe des Objekts in Bytes​ 
    • Last-Modified – Erstellungsdatum oder der letzten Änderung ​ 
  • Benutzer-definierte Metadaten:​ ​ 
    • x-amz-meta-Patient: Homer​ 
    • x-amz-meta-Age: 50​ 
    • x-amz-meta-”Scan of”: Brain​ 
    • x-amz-meta-Scanner: Xray 1​ 
    • x-amz-meta-operator: Bart​ 

Echtzeit-Datenklassifikation für KI-Workflows im Gesundheitswesen

Parallel dazu werden aus unstrukturierten Dokumenten, wie zum Beispiel Arztbriefen oder Entlassungsberichten, wichtige medizinische Informationen extrahiert. Dazu gehören Diagnosen, Medikamente, Labor- und Vitalparameter.  

Durch diesen Prozess werden die ursprünglich unstrukturierten Daten in strukturierte Gesundheitsdaten umgewandelt.  Diese Transformation geschieht in Echtzeit und die gewonnenen Informationen werden als Metadaten direkt für die entsprechenden S3-Objekte gespeichert. 

Durch die zusätzlichen Attribute wird es möglich, dass gezielt Datensammlungen gesucht und zusammengestellt und dann effizient weiterverarbeitet werden können – beispielsweise in KI-Workflows. 

Analytics als weiterer Verwendungszweck 

Die entstandenen Metadaten bieten auch die Möglichkeit, sie gezielt für Analytics-Zwecke einzusetzen. Mit einem geeigneten Data Science Framework wie KNIME lassen sich diese zusätzlichen Metadaten analysieren und visualisieren. 

Insbesondere im Bereich der Gesundheitsdaten und ICD-10-Klassifikationen lassen sich detaillierte Übersichten der Diagnosen erstellen, beispielsweise nach Haupt- und Nebendiagnosen sowie weiteren erhobenen medizinischen Daten. 

Abb.: Die KI-Auswertungen der Patientendaten in Form von Diagrammen und Übersichten

Fazit: KI-gestützte Lösungen für medizinische Daten im Gesundheitswesen bringen Struktur in Datenflut

Große, unstrukturierte Datenbestände stellen viele Organisationen vor Herausforderungen. Die gemeinsame Lösung von Cloudian, Averbis und SVA zeigt, wie sich skalierbarer Objektspeicher mit KI-gestützter Datenanalyse kombinieren lässt, um Daten in Echtzeit zu strukturieren und zu klassifizieren. 

Dadurch können Daten effizienter verwaltet und für weiterführende Anwendungen wie KI-gestützte Workflows oder detaillierte Analysen genutzt werden. Unübersichtliche Datenmengen werden so zu nutzbaren Informationsquellen, die eine gezielte Auswertung und Weiterverarbeitung ermöglichen.