Mehr als eine Million Menschen in Deutschland leiden an Alzheimer-Demenz, Tendenz steigend. Eine Heilung der progressiven, neurodegenerativen Erkrankung ist bislang nicht möglich. Doch wird sie frühzeitig erkannt, lässt sich ihr Fortschreiten verlangsamen. Die Krankheit betrifft hauptsächlich die Bereiche des Gehirns, die für Gedächtnis, Denken und sprachliche Fähigkeiten verantwortlich sind.
In den letzten Jahren wurden viele groß angelegte Studien gestartet, um Daten zu sammeln und so mehr über die Ursachen sowie mögliche Heilmittel der Krankheit zu erfahren. Aufgrund der großen Datenmengen bietet sich die Analyse mithilfe von neuronalen Netzen an. So wurden auch viele Magnetresonanztomographie-Scans (MRT-Scans) gesammelt, die im folgenden Artikel mithilfe von neuronalen Netzen analysiert und ausgewertet wurden. In diesem Zusammenhang wurde sich einer neuen Architektur der „Transformer“ bedient, die sich aufgrund ihrer guten Resultate als Standard im IT-Bereich etabliert hat. Diese wurde für die Auswertung mit anderen Standard-Modellen verglichen.
Aufgabenstellung/Datensatz
Die Aufgabenstellung war herauszufinden, inwiefern ein neuronales Netz aufgrund von MRT-Scans aufzeigen kann, ob und wie stark ein Patient an Alzheimer Demenz erkrankt ist und ob es dies anhand pathologischer Merkmale vollzieht.
Basis der Auswertung ist ein Datensatz aus 6.400 MRT-Bildern. Diese werden mit der Reisberg-Skala, auch Global-Deterioration-Index genannt, in vier Klassen unterteilt:
- nicht dement (3.200 Bilder)
- sehr leicht dement (2.240 Bilder)
- leicht dement (896 Bilder)
- mittel-schwer dement (64 Bilder)
Die Klassifizierung der Bilder wurde von Ärztinnen und Ärzten vorgenommen. Die Bilder sind dabei größtenteils schon vorverarbeitet. Das bedeutet, eine Normalisierung, Entrauschung und, falls nötig, eine Artefaktbereinigung wurden bereits vorgenommen. Durch die ungleichmäßige Verteilung der Klassen ergaben sich verschiedene Herausforderungen. Techniken wie Oversampling, wobei die Anzahl einer zahlenmäßig schwachen Klasse erhöht sowie die Erstellung synthetischer Daten wurden genutzt, um dieses Ungleichgewicht zu mindern.
Als letzten Schritt der Vorverarbeitung wurde mit Pseudo-Color-Enhancement ein Graubild durch eine lineare Funktion in drei Graubilder in die jeweiligen Farben rot, grün, blau zerlegt, um so wichtige Bildmerkmale hervorzuheben. Zu diesen gehören graue und weiße Substanz sowie Ventrikel oder Knochen. Dies ermöglicht sowohl dem Modell als auch den Betrachtern eine bessere Differenzierung der relevanten Gehirnregionen.
Modell-Architektur und Training
Zunächst sollte herausgefunden werden, ob neuronale Netze die MRT-Bilder den entsprechenden Demenz-Klassen mit hoher Genauigkeit zuordnen können. Dazu wurde ein CNN-Transformer gebaut, der die Vorteile von Convolutional Neural Networks (CNNs) mit den Vorteilen von Transformern kombiniert. CNNs dienen der Erkennung lokaler Bildmerkmale, während Transformer globale Zusammenhänge besser erfassen können. Letzteres geschieht durch den Self-Attention-Mechanismus der Transformer, der Sequenzen effizient verarbeiten und lange Abhängigkeiten, die hier als globale Zusammenhänge bezeichnet werden, modellieren kann.
Die ersten Konfigurationen des Modells erreichten schon sehr gute Resultate. Durch eine Hyperparameter-Optimierung mithilfe von Tune[^1] wurde eine Genauigkeit auf dem Testdatensatz von 99,25 % erzielt.
Weitere State-of-the-Art-Modelle, wie ResNet[^2] und EfficientNet[^3] wurden ebenfalls implementiert und evaluiert. Keines dieser Modelle erreichte die präzise Genauigkeit des CNN-Transformers. Zudem ist der CNN-Transformer im Vergleich zu den anderen Modellen relativ klein in Bezug auf den Speicherverbrauch und somit auch verhältnismäßig schnell.
Ergebnisse und Auswertung von KI-Entscheidung
Bei der weiteren Analyse des Modells fiel auf, dass es „eher vorsichtig“ ist. Das bedeutet, dass die wenigen Fehler, die noch bei der Klassifizierung auftraten, vor allem falsch positiv zwischen den Klassen „nicht dement“ und „sehr leicht dement“ sind. Nicht-demente Patienten werden also eher als „sehr leicht dement“ klassifiziert als umgekehrt.
Ein zentrales Anliegen des Projekts war die Erklärbarkeit der KI-Entscheidungen. Im medizinischen Sektor sind die Auswirkungen von Entscheidungen besonders groß. Daher ist die Korrektheit eines Modells enorm wichtig. Es müssen die Entscheidungsgänge des Modells besser nachvollzogen, überprüft und wiederholt werden können. Mit Grad-CAM[^4] (Gradient-weighted Class Activation Mapping) wurden Heatmaps erstellt, die die Bereiche der MRT-Scans visualisieren, welche für die Modellentscheidung ausschlaggebend waren.

Dabei fiel auf, dass die Funktion der Bereiche, die für die Modellentscheidung für eine Klasse ausschlaggebend war, mit den Krankheitsmustern für die jeweilige Klasse übereinstimmte. Die Analyse ermöglichte also wertvolle und nachvollziehbare Einblicke in die pathologischen Prozesse. Somit bietet die visuelle Darstellung der Modellentscheidungen eine klare Grundlage für medizinische Interpretation.
Anwendung
Um die Ergebnisse für die medizinische Praxis nutzbar zu machen, wurde eine interaktive App entwickelt. Diese integriert das Modell und ermöglicht die Klassifizierung neuer MRT-Scans. Die durch das Modell erkannten Auffälligkeiten werden visualisiert. Zudem können Scans auf einen Atlas registriert und spezifischen Gehirnregionen zugeordnet werden. Die Auffälligkeiten pro Region können auch als Tabelle ausgegeben werden. Zudem können Bereiche im interaktiven 3D-Scan markiert und beschriftet werden. Die App bietet so eine benutzerfreundliche Oberfläche, die den Austausch für Forschung und Medizin erleichtert, die Entscheidungsfindung unterstützt und die Weiterentwicklung der Diagnostik fördert.

Es wurden also Modelle entwickelt und miteinander verglichen, die eine sehr genaue Klassifizierung vornehmen können. Des weiteren kann die Aufmerksamkeit dieser Modelle angezeigt und interpretiert werden und ist durch eine App frei und leicht zugänglich.
Fazit
Die vorliegenden Ergebnisse zeigen das Potenzial moderner KI-Methoden wie des CNN-Transformers zur präzisen Diagnose von Alzheimer-Demenz anhand von MRT-Scans. Durch die Kombination aus hoher Genauigkeit und erklärbaren Modellentscheidungen bietet die Arbeit vielversprechende Ansätze für eine verbesserte medizinische Praxis.
Wie durch die Visualisierung mit Grad-Cam gezeigt werden konnte, ist die Erklärbarkeit des Modells, für die gegebene Architektur, gut nachvollziehbar. Dennoch ist das Modell aufgrund seiner vielen Layer weiterhin sehr groß und kann daher als Deep Neural Network bezeichnet werden. Es wäre interessant, eine effizientere Architektur zu finden, die weniger komplex ist.
Darüber hinaus wurde sich nur auf die Auswertung und Analyse von MRT-Scans konzentriert. Es gibt jedoch viele weitere Datenquellen, wie beispielsweise single-Cell-RNA-Sequenzen, die mit den hier verwendeten Daten kombiniert werden könnten. Die Auswertung von RNA-Sequenzen wurde bereits begonnen und das Kombinieren anderer Datenquellen ist geplant.
[^1]: https://docs.ray.io/en/latest/tune/getting-started.html
[^2]: https://arxiv.org/pdf/1512.03385.pdf
[^3]: https://arxiv.org/pdf/2104.00298.pdf
[^4]: https://arxiv.org/pdf/1610.02391.pdf