Robuste KI für Digitale Pathologie

KI-basierte Diagnoseunterstützung in der digitalen Pathologie

Durch eine alternde Bevölkerung und damit einhergehend einer steigenden Anzahl von Krebserkrankungen, sowie einer zunehmenden Anzahl von komplexen Diagnoseverfahren für neue Therapien in der Krebsbehandlung, steigt die Arbeitslast in der Pathologie unaufhörlich an. Gleichzeitig gibt es einen Mangel an Fachkräften. Die Digitalisierung zusammen mit Verfahren der künstlichen Intelligenz bieten hier neue Möglichkeiten für eine Unterstützung in der pathologischen Diagnostik und helfen so die Bedarfslücke zu schließen.

Im Unterschied zur herkömmlichen Pathologie, bei der die Beurteilung von Gewebeproben direkt durch den Pathologen am Mikroskop erfolgt, wird bei der digitalen Pathologie die Gewebeprobe zunächst mit einem mikroskopischen Scanner digitalisiert. Dies ebnet den Weg für eine computergestützte Analyse der digitalisierten Gewebeschnitte mittels KI-basierter Verfahren, z. B. zur Detektion und Charakterisierung von Tumoren oder Identifikation und Quantifikation bestimmter Zelltypen.

Heterogenität und vielfältige Fragestellungen als Herausforderungen

© Fraunhofer IIS
Ausschnitt einer Gewebeprobe, welche mit sechs verschiedenen Scannern digitalisiert wurde. Die Farbunterschiede zwischen den verschiedenen Scannern sind deutlich zu erkennen.

Eine wesentliche Herausforderung bei der Entwicklung einer KI-basierten Diagnoseunterstützung liegt in der starken Heterogenität der digitalen Gewebeschnitte, welche zum Beispiel durch Unterschiede in der Probenpräparation zwischen verschiedenen Kliniken oder durch Einsatz von Gewebescannern verschiedener Hersteller resultieren. Dadurch unterscheiden sich die Aufnahmen mitunter stark beispielsweise im Farbton, der Sättigung oder der Auflösung.

Wünschenswert ist zudem eine leichte Anpassbarkeit der Verfahren anhand lediglich einer geringen Anzahl von Beispielen, für welche eine Expertenbewertung vorliegt, an neue Fragestellungen in der klinischen Forschung. In der digitalen Pathologie stehen zwar große Datenmengen zur Verfügung, die Bereitstellung von Expertenwissen für diese Daten z.B. in Form von Markierungen in den Daten unter Angabe des Gewebetyps, wie sie für überwachte Lernansätze erforderlich ist, ist allerdings sehr zeitintensiv.

Beide Aspekte werden in unserer Forschung adressiert. Am Anwendungsbeispiel der Diagnostik von kolorektalen Adenokarzinomen (Darmkrebs) werden gezielt robuste und anpassbare KI-Verfahren zur automatischen Erkennung von Gewebetypen (wie beispielsweise Tumorgewebe oder Muskelgewebe) entwickelt und erforscht.

Mit Methoden des Few Data und Few Labels Learning die digitale Pathologie revolutionieren

Die Basis zur automatischen Segmentierung eines Gewebeschnitts in verschiedene Gewebeklassen bildet ein sogenanntes „convolutional neural network“ (CNN). Dieses neuronale Netz wird anhand von Beispielbildern trainiert. Zur Evaluation der Robustheit wurden beispielsweise Gewebeschnitte mit sechs verschiedenen Scannern digitalisiert. Auf diesen Daten wird die Klassifikationsgüte der trainierten Modelle verglichen.

Ein Ansatz robuste Modelle zu generieren ist die domänenspezifische Datenaugmentierung, wie sie in der Kompetenzsäule Few Data Learning des ADA Lovelace Centers weiterentwickelt wird. Bei der Datenaugmentierung werden aus vorliegenden Referenzbildern künstlich weitere Bilder durch vorgegebene Transformationen, wie zum Beispiel Helligkeits- oder Farbtonänderungen, generiert. Die Grundidee dabei ist, die Heterogenität in der späteren Anwendung bereits beim Training durch die gezielte Manipulation der Trainingsbilder zu berücksichtigen. Es werden verschiedene Augmentierungstechniken und deren Kombinationen verglichen. Der Fokus liegt dabei auf Veränderungen der Farbwerte des Bildes. So werden beispielsweise der Kontrast und die Sättigung der Bilder geändert, aber auch anwendungsspezifische Farbveränderungen kommen zum Einsatz.

Ein weiterer Fokus liegt auf der Untersuchung von sog. Few-Shot Verfahren aus der Kompetenzsäule Few Labels Learning. Bei diesem Verfahren können nachträglich die Klassen (in unserem Fall Gewebeklassen wie z. B. Tumor), welche unterschieden werden sollen, anhand von wenigen annotierten Daten angepasst werden, ohne dass ein erneutes Training des neuronalen Netzes erforderlich ist (Kompetenzsäule Few Label Learning). Konkret kommen verschiedene Varianten von sog. Prototypical-Networks zum Einsatz. Auch hier ist der Grundbaustein ein CNN. Durch dieses Verfahren können nun auch neue Klassen nachträglich hinzugefügt werden. Man benötigt jeweils nur wenige Beispiele (Vertreter) der neuen Klasse und berechnet anhand dieser eine Klassenrepräsentation.

Es hat sich gezeigt, dass eine Kombination der beiden Verfahren von Vorteil ist und die Robustheit der Prototypical-Networks auf neuen Daten erhöht.

Der nächste Schritt: Mehr Geschwindigkeit für die digitale Pathologie

Bei den bisherigen Untersuchungen kamen zwei CNN-Architekturen zum Einsatz (Xception und ResNet).  Im weiteren Projektverlauf werden nun verschiedene Netzarchitekturen hinsichtlich ihrer Geschwindigkeit und Robustheit verglichen. Da ein digitaler Gewebeschnitt häufig aus mehreren Gigapixeln besteht, ist es eine große Herausforderung die komplette semantische Segmentierung dieses Schnittes unter 10 min auf einem Standard-PC zu realisieren. Daher ist die Auswahl eines neuronalen Netzes mit geringer Ausführungszeit essentiell.

Kooperation Fraunhofer IIS mit Uniklinikum Erlangen in der Digitalen Pathologie

Datenschutz und Datenverarbeitung

Wir setzen zum Einbinden von Videos den Anbieter YouTube ein. Wie die meisten Websites verwendet YouTube Cookies, um Informationen über die Besucher ihrer Internetseite zu sammeln. Wenn Sie das Video starten, könnte dies Datenverarbeitungsvorgänge auslösen. Darauf haben wir keinen Einfluss. Weitere Informationen über Datenschutz bei YouTube finden Sie in deren Datenschutzerklärung unter: https://policies.google.com/privacy

Mit unserer Expertise in der KI-basierten Bildanalyse und Softwareentwicklung für die digitale Pathologie sind wir Ihr Forschungspartner für intelligente Diagnostiklösungen. Unsere Kompetenzen umfassen sowohl klassische Methoden der Bildverarbeitung als auch neueste Deep-Learning-Ansätze.