TECHNIK

Datenanalyse: Big Data in der Medizin

Dtsch Arztebl 2013; 110(41): A-1926 / B-1701 / C-1665

Rüping, Stefan; Graf, Norbert

Foto: Fotolia/Kotkoa

Die Analyse sehr großer Datenmengen ist in der Wirtschaft seit langem etabliert. Eine Studie untersucht die Potenziale von „Big Data“-Techniken in der Medizin.

Das Stichwort Big Data bezeichnet eine Sammlung von Techniken, mit denen sich Datenmengen speichern und analysieren lassen, die bis vor kurzem noch zu groß waren, sich zu schnell änderten oder zu heterogen waren, um sie verarbeiten zu können. Diese drei V’s – Volume, Velocity und Variety – werden gemeinhin als das gemeinsame Kennzeichen von Big Data angesehen. Das Ziel der Analyse ist klar: Es geht darum, Muster und Abhängigkeiten zu finden, die bisher noch nicht aufgefallen sind.

Anzeige

Auch wenn im aktuellen Hype um Big Data viel Marketing mit im Spiel ist – Firmen wie Google, Facebook oder Amazon haben gezeigt, wie sich Geschäftsmodelle revolutionieren lassen, wenn man Daten besser als die anderen analysiert. Auch in der medizinischen Forschung zeigt sich, wie wichtig solche Verfahren sind, Stichwort Next Generation Sequencing oder bildgebende Verfahren. Aber gilt dies auch für die konkrete Anwendung in der medizinischen Praxis?

Eine wesentliche Herausforderung im Gesundheitsbereich stellt der demografische Wandel dar mit einer immer weiter alternden Gesellschaft und dadurch bedingter erhöhter Morbidität des Einzelnen. Gleichzeitig steuert die Medizin von einer reaktiven hin zu einer prädiktiven und präventiven Medizin, die durch frühe Interventionen Krankheiten verhindern oder zumindest früh und dann auch individualisiert behandeln will. Dieser Paradigmenwechsel von einer globalen Medizin zu einer individuellen, stratifizierten Medizin soll dazu führen, dass der Einzelne sich auch im Alter guter Gesundheit erfreuen kann. Nur hierdurch sind dann auch steigende Kosten im Gesundheitssystem zu bekämpfen.

Neues Wissen mittels „Data Mining“-Techniken

Um dies zu erreichen, ist das Sammeln und Zusammenführen großer Mengen heterogener persönlicher Daten notwendig. Hierzu zählen etwa klinische, epidemiologische, bildgebende, molekulargenetische, aber auch ökonomische Daten. Durch die Analyse solcher Daten mittels „Data Mining“-Techniken kann neues Wissen zu Krankheitsentstehung, Prävention und individualisierter Therapie generiert werden. Bei gleichzeitiger Betrachtung ökonomischer Daten lassen sich zudem Modelle entwickeln, die neben einer Optimierung der medizinischen Versorgung parallel Kosteneinsparungen aufzeigen können. Da die Krankenhausinformationssysteme mehrheitlich ökonomische und klinische Daten erfassen, sind die Voraussetzungen für die Entwicklung von Modellen gegeben, die eine optimierte Diagnostik und Therapie aufzeigen und gleichzeitig die ökonomischen Rahmenbedingungen ohne Einbuße an medizinischer Qualität verbessern.

Einige Beispiele aus dem nicht-medizinischen Bereich können die Potenziale verdeutlichen (Kasten).

Umfrage zum Potenzial im Gesundheitsbereich

Big-Data-Techniken bieten viele Perspektiven, medizinische Daten besser zu verstehen und mehr Daten für eine Analyse verfügbar zu machen. Um die Potenziale solcher Techniken im Gesundheitsbereich besser zu verstehen, führt das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Zusammenarbeit mit dem Universitätsklinikum des Saarlandes eine Befragung zum Potenzial neuer IT-Techniken im Gesundheitsbereich durch, an der sich auch Ärzte beteiligen können. Im Rahmen des EU-Projekts EURECA soll untersucht werden, inwieweit Krankenhäuser, Arztpraxen und andere Gesundheitsdienstleister von der Anwendung neuer Techniken zur Datenanalyse profitieren können. Internetadresse: www.soscisurvey.de/eureca.

Dr. Stefan Rüping,
Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, St. Augustin

Prof. Dr. med. Norbert Graf,
Universitätsklinikum des Saarlandes, Klinik für Pädiatrische Onkologie und Hämatologie, Homburg

Allgemeine Beispiele

  • Volume: In der Standortplanung für Einzelhändler werden weniger interne Daten, als vielmehr solche aus vielen großen öffentlichen Datenquellen – Einträge bei Google Maps, Mobilitätsdaten oder Soziodemografie – benutzt. Dies ist auch bei der Planung von Einzugsgebieten von Krankenhäusern und Arztpraxen möglich.
  • Velocity: Im Qualitätsmonitoring in der Industrie kommt es darauf an, schnell Erklärungen für Probleme zu ermitteln, die dem Ingenieur helfen, eine Lösung zu finden. Dazu müssen hochstrukturierte Daten über technische Zusammenhänge analysiert werden, was nur mit rechenintensiven Verfahren möglich ist. Auch in der Analyse verdeckter Qualitätsprobleme oder Nebenwirkungen von Behandlungen in der Medizin ist es häufig nötig, hochstrukturierte Daten zu verstehen, etwa Diagnosebeschreibungen, Laborwerte oder Abrechnungsdaten.
  • Variety: Die Analyse von Internetdaten, zum Beispiel über Diskussionen von Konsumenten über Produkte, kann neue Einsichten in das Kaufverhalten geben. Dazu ist eine Extraktion von hochwertigen Informationen aus Texten nötig, die weiter mit strukturierten Daten korreliert werden müssen. Die Medizin ist unter anderem dadurch charakterisiert, dass einige Daten strukturiert sind, viele andere nur als unstrukturierte Texte vorliegen, wie die komplette schriftliche Patientendokumentation. Erst eine integrierte Betrachtung dieser Daten ermöglicht es, sich ein umfassendes Bild von der Lage zu machen.

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Fachgebiet

Zum Artikel

Alle Leserbriefe zum Thema

Login

Loggen Sie sich auf Mein DÄ ein

E-Mail

Passwort

Anzeige