ArchivDeutsches Ärzteblatt7/2014Datentransparenz: Forschen mit Routinedaten

POLITIK

Datentransparenz: Forschen mit Routinedaten

Krüger-Brand, Heike E.

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...
LNSLNS

Über das Informationssystem Versorgungsdaten können erstmals Daten der gesetzlichen Krankenkassen für Analysen genutzt werden.

Noch im ersten Quartal 2014 wird das Deutsche Institut für Medizinische Dokumentation und Information (DIMDI) damit beginnen, über das Informationssystem Versorgungsdaten aggregierte Datensätze der gesetzlichen Krankenkassen für wissenschaftliche Analysen zur Verfügung zu stellen. Das berichtete Dr. med. Jochen Dreß vom DIMDI beim TMF-Forum Versorgungsforschung am 30. Januar in Berlin.

Dabei handelt es sich um Routinedaten der gesetzlichen Krankenkassen, die das Bundesversicherungsamt (BVA) für den morbiditätsorientierten Risiko­struk­tur­aus­gleich (Morbi-RSA) zwischen den Krankenkassen verwendet und zur Aufbereitung an das DIMDI übermittelt. Diese Daten sollen künftig für einen definierten Nutzerkreis, darunter Krankenkassen, der Gemeinsame Bundes­aus­schuss, die Kassenärztliche Bundesvereinigung, die Bundes­ärzte­kammer sowie Institutionen der Forschung und Gesundheitsberichterstattung, für bestimmte Zwecke zugänglich gemacht werden. Sie können die Daten zum Beispiel für versichertenbezogene Längsschnittanalysen oder die Planung von Leistungsressourcen nutzen. Die gesetzliche Grundlage hierfür ist die Datentransparenzverordnung (DaTraV) vom 18. September 2012 (siehe auch DÄ, Heft 4/2013).

Anzeige

Beim DIMDI werden die Morbi-RSA-Daten erneut pseudonymisiert und über mehrere Jahre hinweg zusammengeführt. Dies eröffnet beispielsweise für die Versorgungsforschung neue Auswertungsmöglichkeiten, denn Daten in dieser Vollständigkeit von circa 70 Millionen Versicherten – über die verschiedenen gesetzlichen Krankenkassen hinweg – waren bisher nicht verfügbar (Kasten).

Langer Zeitverzug

Das DIMDI erhält die Daten vom BVA aufgrund der komplexen Korrektur- und Berechnungsverfahren allerdings mit einer zeitlichen Verzögerung von etwa vier Jahren vom jeweiligen Berichtsjahr bis zur Datenlieferung. „Das ist ein relativ langer Zeitverzug“, meinte Dreß. Ob dies noch verkürzt werden könne, sei sicherlich noch einmal zu bedenken. Zudem erhält das DIMDI nur einen Teil der bei den gesetzlichen Krankenkassen vorhandenen Daten. So ist in dem DaTraV-Datensatz etwa das Regionalmerkmal vorerst nicht verfügbar, das kleinräumige Analysen ermöglichen würde. Ebenso fehlen sozioökonomische Daten. „Ende 2015 wird das Verfahren evaluiert und beispielsweise auch geklärt, ob man den Datensatz erweitert. Jetzt geht es erst einmal darum, zu starten und mit dem Datensatz Erfahrungen zu sammeln“, sagte Dreß.

Antrag als Verwaltungsakt

Das Antragsverfahren ist als Verwaltungsakt geregelt und recht komplex. Es umfasst mehrere Prüfschritte, die sämtlich durchlaufen werden müssen, bevor mit der Datenbereitstellung begonnen wird. In der ersten Ausbaustufe können Nutzungsberechtigte beantragen, dass die Aufbereitungsstelle beim DIMDI Daten entweder anhand eines vom Datennutzer entwickelten, und im Rahmen des Antragverfahrens geprüften und genehmigten SQL-Auswertungsprogramms oder auf Basis einer eingereichten wissenschaftlichen Frage auswertet.

In weiteren Ausbaustufen werden die Datenbereitstellungsverfahren sukzessive erweitert. So sollen Forscher auch die Möglichkeit erhalten, pseudonymisierte Einzeldaten an Gastarbeitsplätzen zu analysieren. Für die Aufbereitung der Daten durch das DIMDI werden Nutzungsgebühren anfallen, deren Höhe jedoch noch nicht feststeht.

Um den Identifikationsschutz zu gewährleisten, seien die Ergebnismengen, die die Datenaufbereitungsstelle verlassen, für sich genommen faktisch anonymisiert, erläuterte Dreß. Dies werde im Wesentlichen durch Aggregierung der Daten erreicht. Zusätzlich gelten für Auswertungen bestimmte Schwellenwerte. So darf in der Regel nur eine Schnittmenge von 30 Prozent der Versicherten oder weniger ausgewertet werden. Zudem kann Dreß zufolge der Verwaltungsakt mit der Auflage verbunden werden, eine vom Nutzer geplante Zusammenführung von Daten zu unterlassen. Darüber entscheidet im Einzelfall die Datenaufbereitungsstelle.

Zwar gehen die Experten davon aus, dass mit der Sekundärnutzung der GKV-Routinedaten generell eine bessere Planung und Steuerung im Gesundheitswesen möglich wird. Für die wissenschaftliche Auswertung ist jedoch noch eine Reihe methodischer Fragen zu klären. Dies betrifft unter anderem die Frage der Datenqualität, da nicht alle Umstände des Erhebungskontextes der Daten bekannt sind. Auch wurden die Daten primär für administrative Zwecke erhoben. „Die Interpretation der Ergebnisse muss vor dem Hintergrund der Stärken und Schwächen der Daten und der Methodik erfolgen“, betonte daher Dr. Ingrid Schubert, PMV-Forschungsgruppe an der Universität Köln. Wissenschaftler müssten sorgfältig prüfen, welche Aussagen anhand dieser Datensätze überhaupt möglich seien.

Viele methodische Fragen

Beispiel Diagnosedaten: Hier ist bei der Auswertung unter anderem zu beachten, dass aus der Diagnosenennung nicht per se auf das Vorliegen einer Erkrankung zu schließen ist. Auch geht aus den Routinedaten nicht direkt hervor, ob eine Erkrankung bereits länger besteht oder neu ist. Zur Validierung von Diagnosen sollten daher stets weitere Informationen aus den Routinedaten, wie Verordnungsdaten oder Diagnosen über mehrere Quartale, herangezogen werden, empfahl etwa Dr. Sascha Abbas, PMV-Forschungsgruppe.

Weitere wichtige Daten, die auf der Wunschliste mancher Experten stehen, sind zum Beispiel die Angabe des diagnosestellenden Arztes, die eine Aufschlüsselung nach Facharztgruppen ermöglichen würde, und das ambulante Konsultationsdatum. Bei den Arzneimitteldaten umfasst die DaTraV-Datenlieferung nur die verschreibungspflichtigen Medikamente aus dem ambulanten Bereich. Nicht enthalten sind beispielsweise Angaben zu OTC- und Lifestyle-Präparaten sowie zur Krankenhausmedikation.

Heike E. Krüger-Brand

umfang des Datensatzes

Die Datenaufbereitungsstelle des DIMDI hat für 2009 folgende Datensätze vom Bundesversicherungsamt erhalten:

  • Stammdaten (Geburtsjahr,Geschlecht, Versichertentage, Krankenkasse etc.): 73 Millionen Datensätze
  • extrakorporale Blutreinigung (Dialyse):
    72 Millionen Datensätze
  • Arzneimittelverordnungen (Verordnungsdatum, Pharmazentralnummer, Anzahl der abgerechneten Einheiten): 626 Millionen Datensätze; Hinweis: keine Angaben zur Anzahl der Verschreibungen
  • ambulante Diagnosen (Leistungsquartal, ICD-10-GM, Zusatzkennzeichnung, Lokalisation, Abrechnungsweg): 1,7 Milliarden Datensätze; Hinweis: keine Angaben zur Häufigkeit des Arztbesuchs
  • stationäre Diagnosen (Entlassungsmonat, Fallzähler, Entlassungsdiagnose nach
    ICD-10-GM, Lokalisation, Haupt- oder Nebendiagnose, Art der Behandlung): 77 Millionen Datensätze
  • Berücksichtigungsfähige Leistungsausgaben (personenbezogene Ausgaben für Ärzte, Zahnärzte, Apotheken, Krankenhäuser etc.): 5 Millionen Datensätze (Stichprobe für 2009/10)

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Deutsches Ärzteblatt plus
zum Thema

Fachgebiet

Zum Artikel

Der klinische Schnappschuss

Anzeige

Alle Leserbriefe zum Thema

Stellenangebote