BELUGA – eine prospektive, registrierte Studie über den Einsatz von KI in der Hämatologie

Beitragsbewertung
Beitrag bewerten

Schon vor Beginn der Corona-Pandemie haben wir erfahren, wie stark die Digitalisierung unser privates und berufliches Leben immer stärker prägt und auch in Zukunft prägen wird. Dies betrifft auch Innovationen für die tägliche Arbeit im papierlosen Münchner Leukämielabor (MLL) und beispielsweise die komplette Digitalisierung sämtlicher Befunde in einer sich stetig verbessernden digitalen Infrastruktur. Doch mit Hilfe künstlicher Intelligenz (KI) beginnt ein neues Zeitalter auch für die medizinische Diagnostik. 

In den letzten Monaten sind dazu viele wissenschaftliche Publikationen erschienen, die den Einsatz künstlicher Intelligenz in zahlreichen klinischen Anwendungen untersucht haben. In diesen Studien werden vielfach neuronale Netzwerke (deep neural network = DNN) genutzt, um die Anwendung von maschinellem Lernen für diagnostische Zwecke zu prüfen. Von der automatisierten Augenhintergrunduntersuchung über die Detektion von Tumorherden in Gewebsschnitten bis zum Erkennen einer COVID-19 Erkrankung im CT sind diese Systeme menschlichen Untersuchern in Geschwindigkeit und Genauigkeit zumeist gleichwertig, aber immer öfter auch überlegen. Die meisten dieser Studien haben jedoch ein retrospektives Format: Eine große Sammlung im Vorfeld annotierter Daten (oder Bilder) wird als Trainingskohorte benutzt, um neue, bislang nicht annotierte Daten durch das Netzwerk klassifizieren zu lassen.

Wir setzen nun mit der vom MLL initiierten Studie BELUGA (Better Leukemia Diagnostics Through AI; Clinicaltrials.gov, NCT04466059) prospektiv an und untersuchen, inwiefern KI-basierte Diagnostik dem konventionellen Goldstandard ebenbürtig oder ggf. überlegen ist.

Unsere KI-Ansätze greifen dabei zurück auf eine Sammlung von aktuell über 600.000 digitalisierten Blutzellen und über 300.000 digitalen Immunphänotypisierungs-Befunden, die  im MLL state of the art befundet und annotiert wurden. Die mit den MLL-Daten trainierten DNN liegen jetzt als Applikationen vor. Diese werden in der BELUGA Studie über den Zeitraum von einem Jahr parallel zum Goldstandard der aktuellen Routinebefundung und Workflows auch für die Befundung der neu eintreffenden Patientenproben prospektiv verwendet. Dabei bleiben die Ergebnisse der KI geblindet. Zu bestimmten Zeitpunkten werden beide Methoden bezüglich definierter primärer Endpunkte verglichen (Sensitivität/Spezifität der Diagnosen, Zeit bis zur Diagnosestellung). Weitere sekundäre Endpunkte betreffen die Stufendiagnostik in Richtung der Molekulargenetik oder der Chromosomenanalyse.

Erstmals wird so in einer prospektiven Untersuchung das Potenzial einer KI-geführten Diagnostik am Beispiel der Zytomorphologie und der Immunphänotypisierung untersucht. Die neu erhobenen Daten werden dabei fortlaufend zum Trainieren des Algorithmus genutzt. Es wäre schon spannend, wenn 200 Jahre nach der Geburt von Rudolf Virchow, dem Erstbeschreiber des „weißen“ Blutes, der hier beschriebene Ansatz der BELUGA-(russisch für weiß) Studie einer KI-basierter Diagnostik zum Einzug in den klinischen Alltag des Hämatologen verhilft.