Medizin
Lungenkrebsscreening: Künstliche Intelligenz erkennt Tumore früher als Radiologen
Dienstag, 21. Mai 2019
Mountain View/Kalifornien – Künstliche Intelligenz könnte künftig die Effektivität der Lungenkrebsfrüherkennung verbessern. Eine von Google entwickelte „Deap-Learning“-Software hat einer Studie in Nature Medicine (2019; doi: 10.1038/s41591-019-0447-x) ein besseres Auge bewiesen als erfahrene Radiologen.
Computer schlagen Menschen nicht nur im Schachspielen. Über kurz oder lang werden sie Ärzten in der Diagnose von bestimmten Krankheiten überlegen sein. Ebenso wie sich professionelle Schachspieler bei der Analyse von Partien heute von Computern unterstützen lassen, werden sich Computer zu einem nützlichen Hilfsmittel für Ärzte entwickeln.
Ein mögliches Einsatzgebiet ist die Früherkennung von Lungenkrebs, die in den USA bereits für starke Raucher empfohlen wird. Die National Lung Screening Trial-Studie (NLST) hatte gezeigt, dass ein Low-Dose-CT-Screening die Sterblichkeit am Bronchialkarzinom von langjährigen Rauchern senken kann. Das Screening ist aber umstritten, da auch erfahrene Radiologen sich bei der Befundung der CT-Aufnahmen irren können. Problematisch ist die relativ hohe Zahl von falsch-positiven Befunden, die bei der Lungenkrebsfrüherkennung riskante und kostenintensive Biopsien zur Folge haben.
Eine von Google entwickelte künstliche Intelligenz könnte die Zuverlässigkeit verbessern. Die Software wurde nach den Prinzipien des „Deap Learnings“ an den Daten der NLST trainiert. Das Team um Shravya Shetty konnte dafür auf 42,290 CT-Aufnahmen zurückgreifen, die von 14.851 Personen gemacht wurden. Darunter waren 578 Personen, bei denen innerhalb eines Jahres per Biopsie eine Lungenkrebsdiagnose gesichert werden konnte.
Der Vorteil des Computers besteht darin, dass er nicht nur etwa 100 zweidimensionale Schichtaufnahmen überblickt. Die Software überprüft dreidimensionale Aufnahmen und stellt nach Möglichkeit Pixel für Pixel einen Vergleich mit früheren Aufnahmen her.
Wie bei der künstlichen Intelligenz üblich, wurde die Software zunächst an einer Zufallsstichprobe geschult. Es folgte ein „Tuning“ an einer zweiten Gruppe, bevor die diagnostische Zuverlässigkeit in einem dritten Testset überprüft wurde.
Bei der Analyse von einzelnen Aufnahmen erzielte die Software eine Sensitivität von 95,2 % und eine Spezifität von 81,3 %. 6 erfahrene Radiologen erreichten eine Sensitivität von 90,0 % und Spezifität von 69,7 %. Dies bedeutet, dass die Software 5,2 % mehr Fälle von Lungenkrebs erkennt und 11,6 % weniger falsch-positive Ergebnisse liefert.
In einem zweiten Vergleich stand der Software und den Ärzten neben der aktuellen noch eine zweite CT-Aufnahme der einzelnen Personen zur Verfügung. Das hat bei beiden die Spezifität verbessert. Die Software erreichte 84,2 % und die Radiologen 83,7 %. Der Vergleich mit den früheren Aufnahmen verschlechterte überraschenderweise die Sensitivität auf 87,5 % mit der Software und 86,7 % bei den Radiologen. Beide, Mensch und Maschine, waren in diesem Vergleich fast gleichauf.
Am Ende dürfte die Software den Arzt auf einen verdächtigen Befund hinweisen und dieser dann die Entscheidung für oder gegen eine Biopsie treffen. Ob dieses Verfahren die Lungenkrebsfrüherkennung verbessert, müsste in klinischen Studien untersucht werden. © rme/aerzteblatt.de
Liebe Leserinnen und Leser,
diesen Artikel können Sie mit dem kostenfreien „Mein-DÄ-Zugang“ lesen.
Sind Sie schon registriert, geben Sie einfach Ihre Zugangsdaten ein.
Oder registrieren Sie sich kostenfrei, um exklusiv diesen Beitrag aufzurufen.
Login
Loggen Sie sich auf Mein DÄ ein
Passwort vergessen? Registrieren

Weiter Weg vom Deep Learning zur KI
Die Frage bleibt aber offen, wer oder "was" stellt die Indikation zum Thorax-CT? Welche Altersgruppen, Komorbiditäten, Risikofaktoren usw. werden berücksichtigt?
Wie werden nicht-neoplastische Parallelbefunde wie Silikose, Sarkoidose, TBC, Narben, Lymphknoten, Atelektasen und sonstige Atemwegserkrankungen beurteilt?
Beim Vergleich mit früheren Thorax-CT- Aufnahmen verschlechterte sich zwar die Sensitivität geringfügig auf 87,5 % mit der Deep Learning Software und 86,7 % bei den Radiologen. Die Spezifität verbesserte sich aber mit der Software auf 84,2 %, bei den Radiologen auf 83,7 %.
Somit waren beide, Mensch und Maschine, in diesem abschließenden Vergleich fast gleichauf.
Mf + kG, Dr. med. Thomas G. Schätzler, FAfAM Dortmund

Nachrichten zum Thema


Kommentare
Die Kommentarfunktion steht zur Zeit nicht zur Verfügung.