THEMEN DER ZEIT

Klinische Studien und Equipoise: Ethische Vorbehalte werden zu oft bemüht

Dtsch Arztebl 2018; 115(3): A-70 / B-63 / C-63

Lange, Stefan; Sauerland, Stefan; Lauterberg, Jörg; Windeler, Jürgen

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...

Das Prinzip der Randomisierung in vergleichenden Studien (RCT) ist in der klinischen Forschung nach wie vor schwer zu etablieren. Sie ist aber – so das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) – zur Klärung offener Fragen das richtige Instrument.

Foto: katty 2016/stock.adobe.com
Foto: katty 2016/stock.adobe.com

Das Prinzip der Randomisierung in vergleichenden Studien (RCT) wurde in der Medizin erstmals in den 1940er-Jahren angewendet (1). Der Begriff beschreibt die zufällige Zuteilung der Patienten zu den zu vergleichenden Interventionen, um so Einflussfaktoren, die diesen Vergleich stören können (Confounder), zu neutralisieren.

So einfach, einleuchtend und alltagsnah – man denke an die Seitenwahl per Münzwurf im Fußball – das Zufallsprinzip ist, so schwer ist es doch noch immer, es in der klinischen Forschung zu etablieren. Ein sehr grundlegender und regelhaft vorgetragener Einwand ist, RCT seien „ethisch nicht (mehr) vertretbar“ (2, 3). Immer steckt in dieser Feststellung die Ergänzung, alle anderen vergleichenden Studiendesigns, zu denen nicht randomisierte Studien, aber auch andere Datenquellen wie Register oder Routinedaten gezählt werden, hätten dieses ethische Problem nicht.

In der Regel wird ein „Equipoise“ – zu deutsch: „Gleichgewicht“ oder „Gleichwertigkeit“ – zwischen zwei alternativen medizinischen Interventionen als die zentrale ethische Voraussetzung für eine RCT angesehen (4). Diese Sichtweise scheint selbsterklärend, erfordert bei genauerer Betrachtung jedoch eine Reihe grundlegender Überlegungen und Festlegungen (5), damit die ethischen Aspekte überhaupt abgewogen werden können. Die relevante Frage ist: „Wer“ muss bezüglich des „Was“ ein „Wie“ definiertes Gleichgewicht feststellen?

Gleichgewichtete Gesamtbilanz

Auf was bezieht sich das Gleichgewicht? Eine Bewertung umfasst nicht nur einen Nutzenaspekt, zum Beispiel die Verlängerung des Überlebens, sondern zielt auf eine Gesamtbilanz aus nützlichen und schädlichen Effekten einer Intervention. Über das Gleichgewicht bei einer solchen Bilanz wird aber wesentlich weniger Einigkeit herrschen als vielleicht über bestimmte Überlebensvorteile durch eine Intervention, was vor allem an zunehmender Komplexität liegt, aber auch daran, dass die Begriffe Nutzen und Schaden nicht eindeutig sind. So kann die „Nebenwirkung“ eines Arzneimittels von dem einen als belastend, von der anderen dagegen als entlastend wahrgenommen werden – zum Beispiel eine sedierende Wirkung haben. Es gibt zudem keine Übereinkünfte, wie zum Beispiel dass positive Effekte auf die Überlebenszeit mit negativen Effekten auf die Lebensqualität gewichtet werden müssen, eine Voraussetzung, um Bilanzen vergleichen und ihre „Gleichheit“ einschätzen zu können.

Daraus folgt auch die Antwort auf die Frage, „wer“ denn das Gleichgewicht zu bewerten hat. Die mit „Equipoise“ beschriebene Ausgangssituation kann nicht von Gruppen und Institutionen, sondern nur von einzelnen Betroffenen bewertet werden, also von denjenigen, die sich für oder gegen die Teilnahme an einer Studie entscheiden wollen (5). Zentrale Voraussetzung ist dabei die faire Aufklärung über den gegenwärtigen Stand des Wissens, um eine informierte Entscheidung treffen zu können. Voraussetzung ist weiter eine freie Entscheidungsmöglichkeit, die nicht mit irgendwelchen Anreizen verbunden sein darf. Auf dieser Basis kann es für Betroffene gute Gründe geben, an einer Studie, auch und gerade an einer RCT teilzunehmen (5, 6). Eine solche Entscheidung unterscheidet sich damit nicht von der Entscheidung, nach sorgfältiger, fairer Aufklärung in eine Therapie einzuwilligen oder eben nicht.

Sofern die einzelnen Betroffenen ein Gleichgewicht verneinen und eine deutliche Präferenz für eine der Alternativen haben, schließt dies ihre Teilnahme an einer RCT aus. Allerdings ist für diese Betroffenen aufgrund ihrer Präferenz auch jeder andere Vergleich praktisch sehr schwierig und wäre auch nicht interpretierbar, da davon ausgegangen werden muss, dass solche Präferenzen mit den Erfolgsaussichten der präferierten Intervention verbunden sind.

Akzeptable Abweichungen

Auch wenn die Frage nach der „ethischen Vertretbarkeit“ letztlich eine Frage an das teilnehmende Individuum ist, lassen sich doch Kriterien anführen, „wie“ man ein Gleichgewicht beschreiben könnte beziehungsweise ab wann es nicht mehr gegeben ist.

Ein Gleichgewicht wird weniger anzunehmen sein, wenn es zwischen Alternativen

1.  einen relevanten Unterschied gibt und

2.  dieser Unterschied mit hinreichender Sicherheit festgestellt wurde und

3. dieser Unterschied in einem oder mehreren patientenrelevanten Endpunkten besteht.

Wichtiger als diese einzelnen Punkte zu operationalisieren – was wegen der Komplexität der Bilanz ohnehin nur schwer gelingen wird – ist es, darauf hinzuweisen, dass es (erst) diese Kombination ist, die ein Gleichgewicht fraglich werden lässt. So muss ein mit großer Sicherheit festgestellter marginaler Unterschied kein Grund sein, das Gleichgewicht infrage zu stellen. Ebenso müssen nicht die ersten Unterschiede bei wenigen Patienten oder unter sehr verzerrungsanfälligen Umständen dazu führen, dass ein Vorbehalt gegenüber der Teilnahme an weiteren Studien ausgesprochen wird. Und schließlich mag es gut gesicherte Unterschiede bei Surrogatparametern wie Laborwerten geben, die über Effekte auf die Prognose der Patienten nichts aussagen. Die Gewichtung der drei Bedingungen wird indikations- und personenabhängig sein. Und schließlich ist auch noch von Bedeutung, wo ein Unterschied „liegt“ und wie er skaliert wird – absolut (Differenz) oder relativ (Quotient). Ein Unterschied in Heilungen von 0 Prozent versus 10 Prozent wird vermutlich zu einer anderen Bewertung bezüglich des „Gleichgewichts“ führen als 45 Prozent versus 55 Prozent (in beiden Fällen 10 Prozent Differenz), ebenso wie 20 Prozent versus. 40 Prozent anders bewertet würden als 2 Prozent versus 4 Prozent (in beiden Fällen ein Quotient von 0,5).

Empirische Untersuchungen zeigen zudem, dass noch relativ deutliche Abweichungen von der Gleichheit als „Equipoise“ akzeptiert werden (7).

Die individuelle Bewertung des Gleichgewichts mit einer informierten Zustimmung zur Teilnahme an einer Studie mag Grenzen haben. In einer sehr eindeutigen Situation – man stelle sich vor, in einer Studie sollte eine Operation unter Narkose mit einer Operation ohne Narkose verglichen werden – wird man sehr geneigt sein, ein Equipoise derart klar abzulehnen, dass es Patienten trotz Aufklärung und informierter Einwilligung quasi verboten wird, an einer solchen Studie teilzunehmen.

Eine Äußerung, dass eine RCT „ethisch nicht (mehr) vertretbar“ sei, beruht fast immer auf der Annahme eines fehlenden kollektiven Equipoises. Abgesehen davon, dass eine solche Bewertung wie dargestellt grundsätzlich unangemessen ist, könnte sie darauf beruhen, dass datengestützt die Sachlage klar ist und eine RCT nicht (mehr) erforderlich. Aber dann können die Überlegungen natürlich nicht nur für RCT gelten, wie weit verbreitet suggeriert wird. Vielmehr würde eine deutliche Abweichung vom Gleichgewicht im Sinne sehr sicheren Wissens jegliche prospektive Form eines Vergleichs unmöglich machen, da es einen Imperativ gäbe, eine bestimmte Intervention anzuwenden. Gleichzeitig macht diese Situation jeden retrospektiven Vergleich unnötig.

Direkte Antworten

Eine besondere Konstellation ergibt sich im Übrigen für das „Equipoise“ bei Phase-1-Studien bei Gesunden oder Phase-2-Studien bei ausgewählten Kranken in frühen Phasen der Arzneimittel- oder Methodenentwicklung. Wir wissen bereits empirisch hinreichend sicher, dass das Nutzen-Risiko-Verhältnis von Arzneimitteln in den Phasen 1 und 2 in deutlich mehr als der Hälfte der Fälle offenbar ungünstig ist, Equipoise also nicht gegeben ist.

Wo liegt „Equipoise“ gar bei der erstmaligen Anwendung einer bestimmten neuen Methode? Hier wird interessanterweise ganz anders gegen die Durchführbarkeit von RCTs argumentiert: Der Vergleich sei gegenüber der neuen Methode unfair, da eine „Lernkurve“ existiere. Bei den ersten Versuchen und dabei einhergehend mit dem Verzicht auf bewährte Maßnahmen sind also offenbar die Erfolgsaussichten besonders schlecht – ein unter dem Gesichtspunkt des Equipoise gravierendes ethisches Problem.

Es gibt eigentlich nur diesen einen Grund, der tatsächlich gegen die Durchführung eines RCT spricht: Die Frage nach der besten Strategie ist bereits mit hinreichender Sicherheit beantwortet.

Eine solche Situation liegt sicher in den zwei folgenden Fällen vor:

  • In der Vergangenheit wurden mehrere RCTs zur Klärung einer Frage durchgeführt, aus deren Gesamtbild sich eine klare Antwort abzeichnet. Prominentes Beispiel dafür ist die thrombolytische Therapie des akuten Herzinfarktes in den 1980er-Jahren (8). Spätestens nach der achten RCT war die Sachlage klar und alle nachfolgenden Studien gegen Placebo waren nicht mehr notwendig. Für die systematische Suche nach RCTs zu einer Fragestellung, um solche überflüssigen Studien zu verhindern, wurde die Cochrane Collaboration gegründet (9). Oft genügen bereits zwei qualitativ hochwertige Studien zu einer eindeutigen Fragestellung mit statistisch signifikanten und klinisch relevanten Ergebnissen, um weitere Studien zu genau dieser Frage obsolet zu machen.
  • Beobachtungen von Patienten unter einer neuen medizinischen Intervention stellen das bekannte Wissen quasi auf den Kopf. Wenn beispielsweise von 100 Menschen mit einer bestimmten Krankheit bislang trotz aller medizinischer Bemühungen 90 innerhalb von vier Wochen verstorben sind und unter der neuen Therapie nun 90 ein ganzes Jahr überleben, ist dieser Unterschied so „dramatisch“, dass sich eine weitere Evaluation erübrigt beziehungsweise sogar verbietet (10).

In diesen Situationen ist die Frage nach dem Nutzen einer Intervention beantwortet. Weitere Studien braucht es nicht. Derlei dramatische Verbesserungen sind jedoch in der Medizin Raritäten.

Solange aber Fragen offen sind, sollten diese auf direktem Weg mit dem besten Instrument beantwortet werden, einem RCT. Hier untaugliche Methoden anzuwenden und damit die Beantwortung von Fragen absehbar zu verzögern, darf mit Fug und Recht unethisch genannt werden.

Dr. med. Stefan Lange, Dr. med. Stefan
Sauerland, Dr. med. Jörg Lauterberg,
Prof. Dr. med. Jürgen Windeler,

Institut für Qualität und Wirtschaftlichkeit
im Gesundheitswesen (IQWiG),
Im Mediapark 8, 50670 Köln

Literatur in Internet:
www.aerzteblatt.de/lit0318
oder über QR-Code

Randomisierte kontrollierte Studien

  • Randomisierte kontrollierte Studien stellen unverändert den Goldstandard für den kausalen Wirksamkeitsnachweis medizinischer Interventionen und deren Nutzenbewertung dar.
  • Das auf die interne Validität bezogene Hauptproblem nicht randomisierter Studien besteht darin, ergebnisverzerrende Störeinflüsse (Confounding) durch ungleich verteilte Patientenmerkmale in den Vergleichsgruppen auch bei statistischer Adjustierung nicht sicher genug kontrollieren zu können.
  • Die Vielfalt von RCT-Designs ist groß und wird stetig weiterentwickelt, um den Erfordernissen verschiedener Forschungskontexte und auch einer hohen Innovationsdynamik gerecht zu werden.
  • Mit pragmatischen RCTs kann dem Argument fehlender Alltagsnähe begegnet werden. So können unmittelbar praxisrelevante Fragen beantwortet werden.
  • Die Frage, ob RCTs und nicht randomisierte Studien in gleicher Weise geeignet sind, klinische Fragen nach Nutzen und Schaden von Interventionen zu klären, lässt sich nicht metaepidemiologisch über reine Ergebnisvergleiche der Studientypen beantworten. Solche Vergleiche sind mit unauflösbaren Interpretationsproblemen verbunden.

Bewertung wissenschaftlicher Studien

Das Deutsche Ärzteblatt bietet in einer inzwischen 24 Beiträge umfassenden Serie zur „Bewertung wissenschaftlicher Publikationen“ grundlegende Informationen und Diskurse zum Thema: www.aerzteblatt.de/serie/35.

Anzeige
1.
Streptomycin treatment of pulmonary tuberculosis. Br Med J 1948; 2(4582): 769–82 CrossRef
2.
Kovesdy CP, Kalantar-Zadeh K: Observational studies versus randomized controlled trials: avenues to causal inference in nephrology. Adv Chronic Kidney Dis 2012; 19 (1): 11–8 CrossRef MEDLINE PubMed Central
3.
Kowalski CJ: When ethics precludes randomization: put prospective, matched-pair observational studies to work. Perspect Biol Med 2013; 56 (2): 184–97 CrossRef MEDLINE
4.
Freedman B: Equipoise and the ethics of clinical research. N Engl J Med 1987; 317 (3): 141–5 CrossRef MEDLINE
5.
Veatch RM: The irrelevance of equipoise. J Med Philos 2007; 32 (2): 167–83 CrossRef MEDLINE
6.
Miller FG, Joffe S: Equipoise and the dilemma of randomized clinical trials. N Engl J Med 2011; 364 (5): 476–80 CrossRef MEDLINE
7.
Johnson N, Lilford RJ, Brazier W: At what level of collective equipoise does a clinical trial become ethical? J Med Ethics 1991;
17 (1): 30–4 CrossRef MEDLINE PubMed Central
8.
Lau J, Antman EM, Jimenez-Silva J, Kupelnick B, Mosteller F, Chalmers TC: Cumulative meta-analysis of therapeutic trials for myocardial infarction. N Engl J Med 1992; 327 (4): 248–54. CrossRef MEDLINE
9.
Chalmers I: The Cochrane collaboration: preparing, maintaining and disseminating systematic reviews of the effects of health care. Ann N Y Acad Sci 1993; 703: 156–63 CrossRef
10.
Glasziou P, Chalmers I, Rawlins M, McCulloch P: When are randomised trials unnecessary? Picking signal from noise. BMJ 2007; 334 (7589): 349–51 CrossRef MEDLINE PubMed Central
1.Streptomycin treatment of pulmonary tuberculosis. Br Med J 1948; 2(4582): 769–82 CrossRef
2.Kovesdy CP, Kalantar-Zadeh K: Observational studies versus randomized controlled trials: avenues to causal inference in nephrology. Adv Chronic Kidney Dis 2012; 19 (1): 11–8 CrossRef MEDLINE PubMed Central
3.Kowalski CJ: When ethics precludes randomization: put prospective, matched-pair observational studies to work. Perspect Biol Med 2013; 56 (2): 184–97 CrossRef MEDLINE
4.Freedman B: Equipoise and the ethics of clinical research. N Engl J Med 1987; 317 (3): 141–5 CrossRef MEDLINE
5. Veatch RM: The irrelevance of equipoise. J Med Philos 2007; 32 (2): 167–83 CrossRef MEDLINE
6. Miller FG, Joffe S: Equipoise and the dilemma of randomized clinical trials. N Engl J Med 2011; 364 (5): 476–80 CrossRef MEDLINE
7.Johnson N, Lilford RJ, Brazier W: At what level of collective equipoise does a clinical trial become ethical? J Med Ethics 1991;
17 (1): 30–4 CrossRef MEDLINE PubMed Central
8.Lau J, Antman EM, Jimenez-Silva J, Kupelnick B, Mosteller F, Chalmers TC: Cumulative meta-analysis of therapeutic trials for myocardial infarction. N Engl J Med 1992; 327 (4): 248–54. CrossRef MEDLINE
9.Chalmers I: The Cochrane collaboration: preparing, maintaining and disseminating systematic reviews of the effects of health care. Ann N Y Acad Sci 1993; 703: 156–63 CrossRef
10. Glasziou P, Chalmers I, Rawlins M, McCulloch P: When are randomised trials unnecessary? Picking signal from noise. BMJ 2007; 334 (7589): 349–51 CrossRef MEDLINE PubMed Central

    Leserkommentare

    E-Mail
    Passwort

    Registrieren

    Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

    Fachgebiet

    Zum Artikel

    Alle Leserbriefe zum Thema

    Login

    Loggen Sie sich auf Mein DÄ ein

    E-Mail

    Passwort

    Anzeige