KI-Modell kann jede 6. Erkrankung vorhersagen

Heidelberg – Daten aus nationalen elektronischen Gesundheitsdatenbanken ermöglichen nicht nur Risikovorhersagen für die meisten Krebsarten. Auch die Risikoeinschätzung für mehr als 1.000 Krankheiten aus anderen Fachgebieten konnte mittels einer trainierten künstlichen Intelligenz (KI) gelingen. Das erklärte Moritz Gerstung vom Deutschen Krebsforschungszentrum (DKFZ) in Heidelberg kürzlich bei einem Presseworkshop.
Das von seinem Team entwickelte Modell namens Delphi konnte jede 6. Erkrankung im ersten Jahr und jede 7. in den 20 nachfolgenden Jahren vorhersagen. Die Delphi-Daten sind bisher nur als Preprint veröffentlicht worden, eine Publikation mit Peer Review befindet sich aber in Revision (medrxiv 2024; DOI: 10.1101/2024.06.07.24308553).
Zuvor hatte das Team um Gerstung mithilfe dänischer Gesundheitsdaten von 6,7 Millionen Personen bereits Vorhersagemodelle für 20 Krebsarten trainiert (Lancet Digital Health 2024; DOI: 10.1016/S2589-7500(24)00062-1). Die Daten der retrospektiven Modellierungs- und Validierungsstudie beinhalteten 400.000 Krebsfälle, klinische Krankheitsverläufe, Gesundheitsfaktoren wie etwa Tabakkonsum und Übergewicht sowie Familiengeschichten (genetische Ursachen).
Die Modelle validierten sie anschließend anhand der Krebsinzidenz zwischen 2015 und 2018 in ganz Dänemark und an Einzelpersonen aus der britischen Biobank. „Das persönliche Krebsrisiko von 20 Tumorarten variierte etwa 5-fach zwischen der Gruppe mit dem niedrigsten und höchsten Risiko“, erklärte Letztautor Gerstung.
Mehr als 1.000 Krankheiten vorhersagen
Das Team vom DKFZ stellet sich die Frage, ob auch andere Krankheiten vorhersagbar sind. Dafür trainierten sie das KI-Modell Delphi-2M (Delphi Large Predictive Health Inference) auf Basis bekannter Sprachmodelle mit Daten von 0,4 Millionen Teilnehmenden der UK Biobank und validieren es in einer Machbarkeitsstudie mit externen Daten von 1,9 Millionen Dänen.
Delphi-2M prognostiziert das Krankheitsrisiko von 1.256 verschiedenen ICD-10-kodierten Krankheiten und Todesfällen bis zum 80. Lebensjahr. „Alleine der Alterungsprozess und das Geschlecht erlauben es, zirka jede 8. Erkrankung (12-13 %), vorherzusagen“, erklärte der Datenwissenschaftler Gerstung.
Vor allem für die ersten 12 Monate treffsicher
Die Vorhersagen von Delphi beruhen auf weiteren Daten der Krankheitsgeschichte und Lebensstilinformationen (unter anderem Rauchen, Alkohol, Körpergewicht). So gelang es der KI im ersten Jahr nach ihrer Analyse jede 6. (17 %) Erkrankung vorherzusagen. Gerstungs Team hatte sich für die Studie speziell Vorhersagen ab dem 60. Lebensjahr angeschaut.
Für die Genauigkeit spielte der Zeitpunkt zwischen Vorhersage und Ereignis eine wichtige Rolle: Nach 20 Jahren (80. Lebensjahr) hatte Delphi nur noch eine Trefferquote von knapp unter 14% (zirka jede 7.).
Besonderes gut vorhersagen ließen sich laut Gerstung die allgemeine Sterblichkeit, wahrscheinlich weil hier eine Vielzahl von Faktoren zusammenfließen. Ebenso konnte Demenz gut vorhergesagt werden, Herz-Kreislauf-Erkrankungen lagen im Mittelfeld. Weniger treffsicher war das Modell für die Vorhersage von Asthma oder Migräne.
Die Genauigkeit sei vergleichbar mit bestehenden Einzelkrankheitsmodellen, heißt es im Preprint. „Insbesondere in den ersten Jahren sieht man deutlich den Effekt der individuellen Krankheitsgeschichte, die die nächsten Erkrankungen bedingen. Nach 20 Jahren reduziert sich dieser Effekt, was zeigt, dass die zukünftige Krankheitsgeschichte nicht endgültig festgeschrieben ist“, so das Fazit des Experten vom DKFZ. Und auch in den jungen Lebensjahren kann Delphi im Mittel noch nicht viel vorhersagen, da die meisten Personen eine relativ dünne Krankenakte haben, ergänzte er auf Nachfrage.
Es gibt diverse Modelle, die einzelne oder wenige Krankheitsrisiken berechnen, beispielsweise QRISK3 – eine Modell, das das Risiko für Herz- und Kreislauferkrankungen vorhersagt (BMJ 2017; DOI: 10.1136/bmj.j2099). „Nach unserem Wissen ist Delphi aber das erste nahezu vollumfängliche Krankheitsmodell“, sagte Gerstung dem Deutschen Ärzteblatt.
Ein Patent hat er bereits beantragt. Das besondere an Delphi sei dessen Fähigkeit, zeitliche Abfolgen zu berücksichtigen, erklärte Gerstung. Denn aktuell weit verbreitete Sprachmodelle basieren bisher nur auf regelmäßigen Wortfolgen und nicht auf Zeitfolgen.
Delphi nicht für alle Länder anwendbar
Nicht berücksichtigt wurden bei Delphi hingegen soziale und geografische Einflussfaktoren oder Versorgungsstrukturkomponenten. Zurzeit sollte man daher davon ausgehen, dass Delphis Vorhersagen nur in anderen westlichen Ländern treffgenau sind, erklärte Gerstung.
Auch diagnostische Bluttests und allgemeine Blutbilder spielen bisher keine Rolle bei der Risikoberechnung. Sie könnten zumindest über einen kurzen Zeithorizont die Vorhersagen verbessern, ist Gerstung überzeugt.
Bis zur Anwendung für therapeutische Zwecke müssen noch genauere Tests und klinische Studien durchgeführt werden, die den Nutzen wie etwa Therapieempfehlungen in Risikogruppen eindeutig belegen.
Einen unmittelbareren Anwendungszweck sieht Gerstung bei der Gesundheitsplanung: Delphis Vorhersage der zu erwartenden Krankheitslast in bestimmten Personengruppen könne zu einer besseren regionalen Bedarfsplanung führen, aber auch die zu erwartbaren Kosten bestimmen.
Der DKFZ-Datenwissenschaftler äußerte sich zudem optimistisch bezüglich der Nutzung deutscher Daten: Ähnliche Anwendungen könnten künftig mittels deutscher Daten trainiert und optimiert werden, anstelle der Daten aus Dänemark oder dem Vereinigten Königreich. Das Gesundheitsdatennutztungsgesetz habe hierfür die Grundlage geschaffen.
Diskutieren Sie mit
Werden Sie Teil der Community des Deutschen Ärzteblattes und tauschen Sie sich mit unseren Autoren und anderen Lesern aus. Unser Kommentarbereich ist ausschließlich Ärztinnen und Ärzten vorbehalten.
Anmelden und Kommentar schreiben
Bitte beachten Sie unsere Richtlinien. Der Kommentarbereich wird von uns moderiert.
Diskutieren Sie mit: