ArchivDÄ-TitelSupplement: PRAXiSSUPPLEMENT: PRAXiS 4/2015Graph-Technologie in der Herzforschung: Daten zur Herzinsuffizienz effektiv managen

SUPPLEMENT: PRAXiS

Graph-Technologie in der Herzforschung: Daten zur Herzinsuffizienz effektiv managen

Dtsch Arztebl 2015; 112(45): [32]

Kelder, Thomas; Radonjic, Marijana; Temme, Holger

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...
LNSLNS

Um das Zusammenspiel der unterschiedlichen Bausteine im menschlichen Körper – wie Moleküle, Zellen, Organe –, aber auch die Umwelteinflüsse in einem Datenmodell anschaulich zu erfassen, sind Graph-Datenbanken geeignet.

Das Gesundheitswesen verfügt heute über einen riesigen Berg an Daten, angefangen bei der Genomforschung über elektronische Patientenakten bis hin zum sensorgestützten Monitoring von Patienten. Damit eröffnen sich neue Chancen, um die vielfältigen Informationen zu einem Gesamtbild des Gesundheitszustandes einer Person zusammenzufügen und neue, verbesserte Diagnoseverfahren und Therapiestrategien zu entwickeln.

Dieses Ziel verfolgt auch das
europäische Forschungsnetzwerk HOMAGE (EU FP7 HOMAGE Konsortium), das die Früherkennung und Prävention von Herzinsuffizienz bei älteren Menschen untersucht. Im EU-Projekt arbeiten 18 Partner aus neun europäischen Ländern und den USA an der Identifizierung und Validierung spezifischer Biomarker der Herzinsuffizienz. Die Forscher konzentrieren sich dabei auf drei Fragen:

Anzeige
  • Wie lässt sich das Herzversagen bei einem Patienten vorhersehen?
  • Warum entwickelt sich die Krankheit bei einigen Patienten anders?
  • Warum reagieren Patienten unterschiedlich auf die Behandlung?

Um diese Fragen zu beantworten, sammelte das HOMAGE-Konsortium Daten von mehr als 45 000 Patienten aus 22 Kohortenstudien, darunter allgemeine Patientencharakteristika sowie klinische Parameter wie Anamnese, Elektrokardiogramme und biochemische Messungen.

Das niederländische Data-Science Unternehmen EdgeLeap, einer der Projektpartner, nutzte die Graph-Datenbank „Neo4j“, um sämtliche Patientendaten zu integrieren und sie mit bestehenden biomedizinischen Erkenntnissen aus öffentlich zugänglichen Datenbanken zu verknüpfen. So entstand eine umfassende Plattform zur Netzwerkanalyse mit allen für den Bereich Herzinsuffizienz relevanten Informationen und Beziehungen. Ein Team von Bioinformatikern durchforscht sie derzeit hinsichtlich interessanter Zusammenspiele und Verbindungen.

Einheitliche Sprache

Die Datenintegration im Life-Science-Bereich erfordert die Nachbildung eines unvollständigen und sich ständig verändernden Modells der Körperfunktionen und des menschlichen Wissens darüber. Dies birgt sowohl praktische als auch konzeptionelle Herausforderungen.

Biologie berechenbar zu machen, scheitert in der Praxis oft daran, dass Biologen und Mediziner die gleichen Merkmale, Symptome oder Ergebnisse je nach Kontext unterschiedlich beschreiben. Die so vergebenen „Labels“ sind daher oft zweideutig. Ein Protein ist so beispielsweise unter mehreren Namen bekannt, wie etwa das Protein FAS (Fas cell surface death receptor), das als APT1, CD95, FAS1, APO-1, fastm, ALPS1A oder auch TNFRSF6 bezeichnet wird. Umgekehrt kann sich ein Name auch auf mehrere Proteine beziehen, wie das Protein „fatty acid synthase“, das ebenso als FAS bekannt ist. Viele Initiativen haben es sich zum Ziel gesetzt, diese Informationen mit Identifikationssystemen und Ontologien zu erfassen und zu strukturieren. Oft aber bleiben die Versuche redundant und unzusammenhängend.

Derzeit gibt es mindestens 35 verschiedene Ontologien, die Herzinsuffizienz und damit verbundene Phänotypen beschreiben. Teilweise überschneiden sie sich, teilweise fokussieren sie nur eine bestimmte, spezifische Applikation. Und so wie das biologische Wissen immer weiter wächst, müssen sich auch diese Modelle ständig verändern und wachsen. Das zeigt das Beispiel der DNA-Forschung, bei der ein Großteil des Genmaterials zunächst als wertlos angesehen wurde, bis es sich als bedeutender Akteur im System entpuppte.

Hohe Dynamik

In konzeptioneller Hinsicht ist die Biologie um ein Vielfaches komplexer als jedes von Menschen entwickelte System. So übt etwa ein Molekül eine andere Funktion aus, je nachdem, ob es im Blut oder in einem Organ gemessen wurde. Alles ist dynamisch: Moleküle werden verarbeitet, gespalten, modifiziert und verändern währenddessen ihre Funktion. Zellen wachsen, sterben ab und bewegen sich frei umher. Alles ist miteinander verbunden, und diese Verbindungen ändern sich je nach Kontext, Zeit und äußerem Einfluss.

Weil Graph-Datenbanken nicht nur einzelne Daten, sondern auch die Beziehungen der Daten untereinander abbilden, eignen sie sich besonders gut, um stark vernetzte und/oder unstrukturierte Informationen anschaulich darzustellen. Sie ermöglichen es, Beziehungen zwischen Entitäten zu modellieren. Mit den flexiblen und beweglichen Datenmodellen lassen sich so neue Erkenntnisse gewinnen und die Anforderungen der Forscher erfüllen. Dazu werden zunächst relevante Quellen ausgewählt, konvertiert und in ein einheitliches Vokabular übertragen. In der Graph-Datenbank finden sich diese Daten in einem Format wieder, das eine effiziente und skalierbare Suche nach Verbindungen und Wegen zwischen den Daten erlaubt.

Im Fall der HOMAGE Netzwerkanalyseplattform zur Herzinsuffizienz enthält die Neo4j-Datenbank mehr als 130 000 Knoten sowie über 6,5 Millionen Beziehungen. Knoten bezeichnen dabei verschiedene Arten von Informationen, zum Beispiel bei Patienten gemessene Parameter, Krankheiten, Phänotypen, biologische Prozesse, Medikamente, Moleküle, Gene oder miRNAs. Beziehungen beschreiben, wie diese Knoten auf verschiedenen Ebenen miteinander verbunden sind. Zu diesen zählen beispielsweise Patientenparameter, die nach Messung einer bestimmten Kohorte miteinander verbunden sind, Proteine, die mit bestimmten Krankheiten in Zusammenhang gebracht werden, Enzyme, die Medikamente umwandeln, sowie Transkriptionsfaktoren, die die Ausprägung eines Gens steuern. Durch die Integration von ausgewählten Informationen aus 20 verschiedenen öffentlichen Datenbanken wie DisGeNET, Drugbank, WikiPathways und PubMed, ermöglicht die Plattform ein umfassendes Bild über den derzeitigen Kenntnisstand zur Herzinsuffizienz.

Analyse im Netzwerk

Nach der Aufnahme aller relevanten Parameter und Kenntnisse in die Graph-Datenbank können die HOMAGE-Forscher nun die Informationen effektiv durchsuchen und auswerten. Bioinformatiker nutzen die Plattform als Wissensbasis für Datenanalyse-Skripts und Anwendungen, um Vorhersagemodelle zu generieren, Netzwerk-Topologien zu quantifizieren, Zentralität zu berechnen, zeitaufgelöste Patientendaten abzugleichen (Abbildung 2) sowie Muster und Faktoren zu identifizieren, die zu neuen Biomarkern oder Wirkstoff-Targets führen können.

Analyse von Patientendaten mit der Netzwerkanalyseplattform: Das Modell zeigt verschiedene Moleküle (Knoten durch Zentralität skaliert) und Mechanismen (farbige Netzwerk-Cluster) zu verschiedenen Zeitpunkten nach einem kardialen Ereignis.
Abbildung 2
Analyse von Patientendaten mit der Netzwerkanalyseplattform: Das Modell zeigt verschiedene Moleküle (Knoten durch Zentralität skaliert) und Mechanismen (farbige Netzwerk-Cluster) zu verschiedenen Zeitpunkten nach einem kardialen Ereignis.

Ursprünglich für Bioinformatiker entwickelt, stößt die Plattform zunehmend auch bei klinischen Forschern auf Interesse. Sie stellt eine direkte Möglichkeit dar, Biomarker für Herzinsuffizienz vor dem Hintergrund bestehender Kenntnisse abzufragen und zu untersuchen (Abbildung 1).

Das Abfragebeispiel stellt nicht nur Biomarker dar, die bei Einnahme einer vorgegebenen Medikamentenklasse beeinträchtigt werden, sondern auch die Mechanismen dabei. Dies hilft Ärzten zu entscheiden, welche Biomarker bei speziellen Patientenpopulationen beobachtet werden müssen.
Abbildung 1
Das Abfragebeispiel stellt nicht nur Biomarker dar, die bei Einnahme einer vorgegebenen Medikamentenklasse beeinträchtigt werden, sondern auch die Mechanismen dabei. Dies hilft Ärzten zu entscheiden, welche Biomarker bei speziellen Patientenpopulationen beobachtet werden müssen.

Thomas Kelder, Marijana Radonjic, EdgeLeap;
Holger Temme,
CEMEA, Neo Technology

Das Abfragebeispiel stellt nicht nur Biomarker dar, die bei Einnahme einer vorgegebenen Medikamentenklasse beeinträchtigt werden, sondern auch die Mechanismen dabei. Dies hilft Ärzten zu entscheiden, welche Biomarker bei speziellen Patientenpopulationen beobachtet werden müssen.
Abbildung 1
Das Abfragebeispiel stellt nicht nur Biomarker dar, die bei Einnahme einer vorgegebenen Medikamentenklasse beeinträchtigt werden, sondern auch die Mechanismen dabei. Dies hilft Ärzten zu entscheiden, welche Biomarker bei speziellen Patientenpopulationen beobachtet werden müssen.
Analyse von Patientendaten mit der Netzwerkanalyseplattform: Das Modell zeigt verschiedene Moleküle (Knoten durch Zentralität skaliert) und Mechanismen (farbige Netzwerk-Cluster) zu verschiedenen Zeitpunkten nach einem kardialen Ereignis.
Abbildung 2
Analyse von Patientendaten mit der Netzwerkanalyseplattform: Das Modell zeigt verschiedene Moleküle (Knoten durch Zentralität skaliert) und Mechanismen (farbige Netzwerk-Cluster) zu verschiedenen Zeitpunkten nach einem kardialen Ereignis.

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Fachgebiet

Zum Artikel

Anzeige

Alle Leserbriefe zum Thema

Stellenangebote