Deep Learning in medizinischer Diagnostik und Qualitätskontrolle

Mi 15.05.2019 - 11:10 Uhr

von Thilo Stadelmann, Professor für Informatik; Frank-Peter Schilling, wissenschaftlicher Mitarbeiter - Institut für angewandte Informationstechnologie (InIT), Zürcher Hochschule für Angewandte Wissenschaften ZHAW

Künstliche Intelligenz und maschinelles Lernen eröffnen vielversprechende Anwendungsmöglichkeiten in der Medizin. Insbesondere Deep-Learning-Algorithmen bieten neue Lösungsansätze sowohl in der bildgestützten medizinischen Diagnostik als auch in der Qualitätskontrolle von Medizinprodukten.

‹ ›

Thilo Stadelmann, Professor für Informatik, Institut für angewandte Informationstechnologie (InIT), Zürcher Hochschule für Angewandte Wissenschaften ZHAW. (Source: MALLAUN PHOTOGRAPHY)

Frank-Peter Schilling, wissenschaftlicher Mitarbeiter, Institut für angewandte Informationstechnologie (InIT), Zürcher Hochschule für Angewandte Wissenschaften ZHAW

In den letzten Jahren hat künstliche Intelligenz (KI) durch maschinelles Lernen einen enormen Aufschwung erlebt. Prominente Beispiele sind Bild- und Spracherkennung, maschinelles Übersetzen und virtuelle Assistenten wie Amazon Alexa, aber auch selbstfahrende Autos. Die Performance von Algorithmen, die auf maschinellem Lernen basieren, übersteigt in einzelnen Bereichen immer häufiger die des Menschen. So stellte etwa 2016 die Google-Tochter Deepmind das Programm "AlphaGo" vor, das beim Brettspiel Go die weltbesten Spieler besiegte.

In der Regel basieren solche KI-Algorithmen auf künstlichen neuronalen Netzwerken. Sie bestehen aus sehr vielen einfachen, untereinander verbundenen Einheiten; in Anlehnung an die Nervensysteme von Lebewesen "Neuronen" genannt. Diese Struktur erlaubt es, komplizierte nichtlineare Funktionen abzubilden und zu erlernen. Das Lernen geschieht durch einen iterativen Prozess, bei dem die Gewichte der Verbindungen zwischen den einzelnen Neuronen angepasst werden, um die Performance auf einem Trainingsdatensatz zu optimieren.

Während der letzten fünf bis zehn Jahre hat die Erforschung neuronaler Netzwerke grosse Fortschritte gemacht. Verbunden mit der heute verfügbaren Rechenleistung ist es jetzt möglich, komplexe neuronale Netzwerke mit sehr vielen Lagen von Neuronen erfolgreich zu trainieren. Man spricht hier von "Deep Learning". Ein prominentes Anwendungsgebiet für Deep Learning mit viellagigen neuronalen Netzen ist die Bilderkennung. Hier kommt eine spezielle Netzarchitektur zum Einsatz, die auf die Verarbeitung von mehrdimensionalen Inputdaten mit lokalen Abhängigkeiten optimiert ist, wie sie in Bildern vorliegt ("Convolutional Neural Networks"): die einzelnen Bildpunkte sind in x- und y-Richtung angeordnet und eng korreliert mit den anderen Bildpunkten in ihrer direkten räumlichen Nachbarschaft.

Deep Learning in der Medizin

Die Medizin bietet vielfältige Anwendungsmöglichkeiten für KI und Deep Learning. Diese reichen von der Diagnostik mittels mikroskopischer Gewebeaufnahmen oder modernen bildgebenden Verfahren (CT, MRT, PET) über die Entwicklung neuer Medikamente bis hin zu individualisierten Behandlungen von Patienten.

Eine herausragende Anwendung der bildgebenden Diagnostik besteht in der Analyse von menschlichem Gewebe, wobei gutartige von bösartigen Veränderungen (Tumore) unterschieden werden müssen. Wissenschaftler an der Universität Stanford haben einen Deep-Learning-Algorithmus zur bildgestützten Erkennung von Hautkrebs entwickelt, der mit 130 000 Aufnahmen trainiert wurde und eine Leistungsfähigkeit besitzt, die mit speziell ausgebildeten Dermatologen konkurrieren kann. In Zukunft wird es möglich sein, mittels einer Smartphone-App eine Erstdiagnose durchzuführen, die den Arzt unterstützt, aber auch in entlegenen Gebieten der Erde ohne ausreichende flächendeckende medizinische Versorgung einen grossen Vorteil bieten könnte.

Die Arbeitsgruppe Information Engineering am Institut für angewandte Informationstechnologie (InIT) der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) beschäftigt sich seit einigen Jahren mit praktischen Anwendungen von maschinellem Lernen in angewandten Forschungsprojekten mit industriellen Partnern. Ein Schwerpunkt ist hierbei die Bilderkennung mit neuronalen Netzen. Die Projekte reichen von der Gesichtserkennung über die Segmentierung von Zeitungsartikeln bis hin zur Umwandlung von Musik in Form von gedruckten Notenblättern in ein maschinenlesbares Format oder die Diagnostik von Röntgenbildern.

Vollautomatisierte Qualitätskontrolle von Ballonkathetern

Ein anderes Anwendungsgebiet von KI ist die Medizinaltechnik. Hier können Deep-Learning-Methoden in der Qualitätskontrolle bei der Herstellung medizinischer Produkte zum Einsatz kommen. In Zusammenarbeit mit der Firma BW-TEC in Höri (ZH) wird an der ZHAW ein System zur vollautomatischen optischen Qualitätskontrolle von kardialen Ballonkathetern entwickelt. Die manuelle visuelle Kontrolle der Katheter auf Produktionsmängel wie Kratzer, Materialeinschlüsse oder Blasen ist sehr aufwändig, bei gleichzeitigen sehr hohen Qualitätsanforderungen: Die Erkennungsrate von defekten Kathetern muss Nahe an Eins liegen, während der Anteil von aussortierten, aber nicht defekten Exemplaren ("false positive rate") nicht zu hoch sein darf.

Effizienzsteigerung um ein Vielfaches

Die manuelle optische Kontrolle findet bisher durch einen Operator statt. Dies geschieht zum Teil im Gegenlicht, in Polarisationsoptiken oder unter dem Mikroskop, was zu stark streuenden Ergebnissen führen kann. Durch eine automatisierte Kontrolle kann die Qualitätsprüfung um ein Vielfaches effizienter gestaltet werden, während Spezialisten sich diejenigen Exemplare noch einmal ansehen können, für welche die Maschine zu keiner sicheren Einschätzung gelangen konnte. Zu diesem Zweck wird ein Deep-Learning-Algorithmus trainiert, der aufgrund mehrerer, unter verschiedenen Blickwinkeln aufgenommener Aufnahmen entscheidet, ob ein Katheter fehlerhaft ist oder nicht.

Als Startpunkt werden mehrere hochperformante Architekturen von neuronalen Netzen verwendet, die bei anderen Anwendungen bereits sehr gute Ergebnisse erzielt haben ("transfer learning"). Das Training zur Erkennung von defekten Ballonkathetern erfolgt dann mit einem Datensatz von zirka 5000 Aufnahmen, die bereits von menschlichen Operateuren vorklassifiziert wurden. Der Trainingsprozess ist sehr rechenintensiv, da hierbei jede Aufnahme viele Male von dem Algorithmus ausgewertet und die Anpassungen der Netzwerkparameter neu berechnet werden müssen. Hierzu kommt ein auf solche Rechenoperationen spezialisierter, dedizierter Server mit Nvidia-GPUs zum Einsatz.

Aufnahmen von Ballonkathetern ohne (oben) und mit (unten) Defekt.

Quantität und Qualität der Trainingsdaten sind entscheidend

Wichtige Faktoren für die Leistungsfähigkeit von Deep-Learning-Algorithmen zur Bilderkennung sind die Quantität und Qualität der Trainingsdaten. Ein möglichst grosser und variabler Trainingsdatensatz stellt eine Grundvoraussetzung dar, um ein komplexes neuronales Netz erfolgreich trainieren zu können. Ebenso entscheidend ist die Qualität der Trainingsdaten. So wurden detaillierte Studien durchgeführt, um optimale Licht- und Aufnahmebedingungen herzustellen.

Die bisherigen Ergebnisse sind sehr positiv: Auf einem unabhängigen Validierungsdatensatz wurde eine Defekt-Erkennungsrate von über 98 Prozent erzielt. Ein Vorteil von Deep Learning mit neuronalen Netzen gegenüber traditionellen Algorithmen zur Bilderkennung ist ausserdem, dass das System auch auf neuartige Fehlersignaturen reagieren kann, die nicht im Training vorgegeben wurden. Zurzeit befindet sich ein Prototyp im Aufbau.

Vielversprechende Anwendungsmöglichkeiten

Bilderkennung mit Deep-Learning-Architekturen eröffnet vielversprechende Anwendungsmöglichkeiten in der Medizin, sowohl in der Diagnostik als auch in der Medizinaltechnik. Es besteht das Potenzial zu grossen Effizienzsteigerungen und verbesserten Behandlungen zum Wohle der Patienten. Dabei wird nicht zuletzt auch die "Erklärfähigkeit" von KI-Algorithmen eine wichtige Rolle spielen: Das nötige Vertrauen in KI kann dadurch gestärkt werden, dass diese eine "Erklärungskomponente" besitzt, sodass die KI-Entscheidung gegenüber Arzt und Patient verständlich und nachvollziehbar wird.

Artikel teilen: