ArchivDeutsches Ärzteblatt30/2001Wirksamkeitsprüfung: „Doppelblindstudien“ und komplexe Therapien

THEMEN DER ZEIT

Wirksamkeitsprüfung: „Doppelblindstudien“ und komplexe Therapien

Dtsch Arztebl 2001; 98(30): A-1942 / B-1826 / C-1555

Schuck, Peter; Müller, Horst; Resch, Karl-Ludwig

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...
LNSLNS Für die Prüfung komplexer, „ganzheitlicher“ Therapien
muss nicht bekannt sein, welchen Teilbeitrag einzelne Komponenten leisten oder wie das „Ganze“ funktioniert.


Eigentlich befinden sich die Homöopathen in einer für viele beneidenswerten Position: Eine in der führenden europäischen Medizinfachzeitschrift publizierte und methodisch sehr gut aufbereitete Meta-Analyse auf der Basis von 89 randomisierten, kontrollierten Doppelblindstudien zur Wirksamkeit der Homöopathie (Lancet 1997; 350: 834–843) kommt zu dem Schluss, dass sie im Ergebnis nicht mit dem Vorwurf vereinbar ist, die homöopathischen Effekte beruhten nur auf Placeboeffekten (1). Es wäre leicht vorstellbar, dass Vertreter der Homöopathie mit dieser oder einer anderen (2) Meta-Analyse sowie den ihnen zugrunde liegenden Originalarbeiten unter dem Arm beim Bundes­aus­schuss der Ärzte und Krankenkassen (3) vorstellig würden, um die Vergütung ihrer Leistungen durch die gesetzlichen Krankenkassen einzufordern. Ihr Ansinnen könnte sich zumindest formal auf eine empirische Wirksamkeitsevidenz berufen, von der viele andere in der Schulmedizin angewandte „einfache“ oder ihr oft viel näher stehende komplexe Therapieformen (4), wie zum Beispiel die Kur (5) oder die Rehabilitation (6, 7), nur träumen können, die aber (noch) im Erstattungssystem sind.
Natürlich wurde im Nachgang zu dieser Meta-Analyse versucht, das schulmedizinisch völlig unerwartete Ergebnis zu „erklären“, etwa mit der unterschiedlichen Qualität einzelner Studien und ihrem Einfluss auf das Ergebnis, mit unterschiedlichen Ergebnissen einzelner Studien bei Anhängern und Nicht-Anhängern der Homöopathie oder mit dem Publikationsbias zuungunsten negativer, das heißt nicht signifikanter Ergebnisse und Ähnlichem (8, 9).
Dessen ungeachtet steht das Resultat dieser Meta-Analyse nun einmal im Raum, und man wundert sich, warum ein Vertreter der Homöopathie, statt auf dieses Ergebnis hinzuweisen, im Deutschen Ärzteblatt (DÄ, Heft 13/2001) zu erklären versucht, warum „Doppelblindversuche“ für alternative Heilmethoden im Allgemeinen und für die Homöopathie im Speziellen völlig ungeeignet sind (10).
Sicherlich ist nicht alles, was als „Placeboeffekt“ bezeichnet wird, tatsächlich ein Placeboeffekt, und viele Definitionen vom Placeboeffekt sind fragwürdig oder unvollständig. Immerhin findet sich in der Literatur die Unterscheidung zwischen „echtem“ („true“) und wahrgenommenem („perceived“) Placeboeffekt (11), wobei Letzterer zusätzliche unspezifische Komponenten, wie zum Beispiel den „natürlichen“ Verlauf (Spontanheilung), Regressionseffekte zur Mitte, andere zeitliche Einflüsse und nicht bekannte Parallelinterventionen, umfasst. Um beide zu trennen, wurde vorgeschlagen, eine zusätzliche Kontrollgruppe ohne „Scheinbehandlung“, also ohne Placebotablette oder -injektion, einzuführen (11).
Wirksamkeitsnachweis
ist entscheidend
Letztlich ist aber auch für die Homöopathie der Wirksamkeitsnachweis entscheidend und nicht, was „richtige“ oder „falsche“ Placebodefinitionen sind. Entscheidend ist auch nicht, ob es ein pharmakologisch akzeptiertes Wirkmodell gibt oder nicht. Letzteres ist auch keine notwendige Voraussetzung für die Wirksamkeitsprüfung. Schon in den 20er-Jahren des vergangenen Jahrhunderts wäre es theoretisch möglich gewesen, eine Wirksamkeitsprüfung für Acetylsalicylsäure zur Behandlung von Kopfschmerzen durchzuführen – auch nach noch heute akzeptierten Prinzipien –, ohne dass zu dieser Zeit der biochemische Wirkmechanismus bekannt gewesen wäre. Entsprechend muss für die Prüfung komplexer, „ganzheitlicher“ Therapien nicht bekannt sein, welchen Teilbeitrag einzelne Komponenten leisten oder wie das „Ganze“ funktioniert. Es lässt sich die Wirksamkeit des Gesamtpaketes prüfen, um dann gegebenenfalls in einem zweiten Schritt die effektivsten Teilkomponenten zu isolieren. Dies ist forschungsökonomischer, als zunächst Einzelkomponenten zu prüfen. Die (Un-)Wirksamkeit einzelner Bestandteile sagt nichts über die Effektivität des Gesamtpakets aus. Diese kann größer, aber auch kleiner sein als die einfache Summe seiner Teile, soweit diese überhaupt im Einzelnen bekannt sind.
Umgekehrt ersetzt kein noch so weithin akzeptiertes pharmakologisches Wirkmodell die klinische Wirksamkeitsprüfung nach üblichen Standards.
Strenge Maßstäbe
Therapien außerhalb der Schulmedizin – und insbesondere solche ohne allgemein „plausibles“ Wirkmodell – haben es schwerer, einen überzeugenden Wirksamkeitsnachweis zu liefern, da an sie besonders strenge Maßstäbe angelegt werden (12). Selbst kleinere Fehler oder Ungenauigkeiten in der Darstellung, die in der „mainstream medicine“ kaum jemandem auffallen oder erwähnenswert erscheinen, werden aufmerksam registriert und kritisch gegen die Studie angemerkt.
Ein verkürzender Begriff wie „Doppelblindversuch“ für das, was im angloamerikanischen Sprachraum meist mit „randomized, controlled (clinical) trial“ (RCT) (13) – gegebenenfalls „double-blind“ – umschrieben wird, darf aber nicht dazu verleiten, dass viele Vertreter komplexer und/oder alternativer Therapieformen – auch wenn sie teilweise der Schulmedizin viel näher stehen und von dieser eher akzeptiert werden als die Homöopathen – einer Reihe von Missverständnissen erliegen.
Es sei durchaus zugestanden, dass Begriffe wie „randomisierte, kontrollierte Studie“ oder „Verblindung“ Methoden und Techniken eines Versuchsdesigns beschreiben, nicht aber die Ziele, die damit jeweils erreicht werden sollen. Die Ziele sind jedoch das Entscheidende.
Insbesondere verhindert die verkürzende Wortwahl offenbar, dass zwei mit dieser Methodik verfolgte Ziele klar genug getrennt werden, wobei das erstere das wichtigere ist:
Ziel: hohe Strukturgleichheit
Ziel der randomisierten, das heißt der streng nach Zufallsprinzipien gesteuerten, Zuweisung von Patienten auf Index- und Vergleichsgruppe ist eine möglichst hohe Strukturgleichheit in diesen Gruppen hinsichtlich bekannter wie unbekannter Störgrößen („konfundierende Variablen“ oder ähnliche Begriffe werden in diesem Zusammenhang auch benutzt), damit ein unter Umständen bei der Auswertung der Ergebnisse festzustellender Unterschied zwischen den Gruppen tatsächlich auf die zu prüfende Therapie kausal zurückgeführt werden kann.
Dies beschreibt den Idealfall. Auch Randomisierung führt – insbesondere bei kleineren Stichprobenumfängen – nicht immer dazu, dass die Störgrößen gleichmäßig auf die zu vergleichenden Gruppen verteilt werden. Nicht zuletzt deshalb ist eine randomisierte Studie zu wenig, um über Wirksamkeit oder Unwirksamkeit einer Therapie entscheiden zu können. Stattdessen werden heute Meta-Analysen mit vielen Studien, möglichst an unterschiedlichen Zentren durchgeführt, für eine derartige Bewertung bevorzugt.
Gäbe es eine Technik, die das Ziel der Strukturgleichheit genauso gut – oder eventuell sogar besser – erreicht wie die klassische randomisierte Studie, so spricht nichts dagegen, diese neue Methode einzusetzen. Randomisierung ist kein Selbstzweck. Derartige Modifikationen sind schon öfters diskutiert worden (zum Beispiel [14]), haben sich aber bisher auf breiter Front nicht durchgesetzt.
Für diese Zielanforderung ist es unerheblich, ob es sich bei der zu prüfenden Therapie um schulmedizinische Medikamente, homöopathische Mittel/Therapien oder andere komplexe Therapien (15) handelt.
Ziel der so genannten Verblindung ist dagegen die Vermeidung einer potenziellen Bewertungsverzerrung der eingesetzten Therapie durch den Arzt (deswegen die untersucherseitige Verblindung) oder den Patienten (daher die patientenseitige Verblindung) beziehungsweise, sie in den zu vergleichenden Gruppen konstant zu halten. Das heißt, weder Untersucher noch Patient sollen wissen, welche Therapie der Patient erhält beziehungsweise erhalten hat.
Bei etwas gutem Willen (und entsprechender finanzieller Unterstützung) wird man die untersucherseitige Verblindung auch bei komplexen und/oder alternativen Therapieverfahren fast immer realisieren können, vorausgesetzt, man trennt die Person des Therapeuten und desjenigen, der das Ergebnis der Therapie aus medizinischer Sicht erhebt und bewertet.
Gerade bei komplexen Therapieverfahren (zum Beispiel Psychotherapieverfahren oder bei Rehabilitationsmaßnahmen, auf die Homöopathie aber in der Regel nicht zutreffend) ist jedoch auf Patientenseite eine Verblindung oft nicht möglich.
Weiterhin „Goldstandard“
Wenn die Ergebnisbewertung einer Therapie in hohem Maß von der subjektiven Einstellung und Bewertung der Behandelten abhängt, kann es in der Tat zu verzerrten Ergebnissen kommen. Dies muss aber nicht sein, wie zahlreiche, nur untersucherseitig verblindete Studien mit unerwartetem Ergebnis zeigen (zum Beispiel [16]).
Zudem ist es jedem Studienleiter unbenommen, die subjektiven Präferenzen hinsichtlich zu vergleichender Therapien bei seinen Probanden mitzuerheben – und bei der Auswertung entsprechend zu berücksichtigen – oder zum Beispiel gleich Varianten des klassischen randomisierten Studiendesigns anzuwenden, die Patientenpräferenzen von vorneherein berücksichtigen (17).
Kürzlich zeigten zwar zwei ausführliche Reviews (18, 19), dass sorgfältig kontrollierte, aber nicht randomisierte Parallelgruppenstudien nicht notwendigerweise zur Überschätzung der Wirksamkeit medizinischer Therapien führen, wie zuvor zumindest in der Medizin häufig unterstellt (was beispielsweise in der Psychotherapieforschung schon länger bekannt ist [20, 21]). Randomisierte Studien bleiben dennoch der international akzeptierte „Goldstandard“ zur Wirksamkeitsprüfung von Therapien (22).
Meta-Analysen notwendig
Viele Vertreter komplexer und/oder komplementärmedizinischer Therapien argumentieren jedoch, dass

c die hochgradig individualisierte Therapie Randomisierung und Verblindung verbiete oder diese unmöglich mache;
c beziehungsweise dass damit nicht die Therapie selbst, sondern die an der Studie teilnehmenden Therapeuten geprüft würden;
c die Nicht-Verblindbarkeit der Patienten bei vielen komplexen und/oder komplementärmedizinischen Verfahren auch eine randomisierte Zuweisung zu Index- und Vergleichsgruppe sinnlos, überflüssig oder „nicht forschungspraktikabel“ mache.
Während gerade für die Homöopathie Ersteres widerlegt ist (23), muss für die zweite Argumentation zugestanden werden, dass bei praktisch allen komplexen Therapien eine klare Trennung zwischen Therapie- und Therapeuteneffekt ohne weiteres meist nicht möglich ist. In gewisser Weise gilt dies aber auch für die klassische Medikamentenstudie. Auch hier gehen in die Prüfung etwa Schwankungen in der pharmazeutischen Qualität des Verums ein oder zum Beispiel undokumentierte Abweichungen vom Studienprotokoll durch Prüfarzt und/oder Patient. Auch dies kann das Ergebnis verzerren und ist ein weiterer Grund für die Forderung nach Meta-Analysen auf der Basis mehrerer Studien von unabhängigen Forscher-

teams zur Wirksamkeitsbeurteilung einer Therapie.
Die dritte Argumentation läuft darauf hinaus, ein potenzielles Manko einer Studie (Nicht-Verblindbarkeit der Patienten) durch Verzicht auf Randomisierung noch zu verschärfen, womöglich in der Vorstellung, dass das eine das andere kompensieren könne, was völlig unsinnig wäre.
Die Designanforderungen an Wirksamkeitsstudien sind nur in Ausnahmefällen Methode der Wahl, um unerwünschte Nebenwirkungen von Therapien aufzudecken oder die Toxizität von Stoffen (zum Beispiel Rauchen) nachzuweisen. Sie hierfür zu fordern – und nur randomisierte und unter Umständen verblindete Studien als Nachweis der Gefährlichkeit mancher Substanzen zuzulassen – wäre verhängnisvoll.
Diese unterschiedlichen Designanforderungen resultieren aus unterschiedlichen Fehlerarten bei einer falschen Entscheidung: Im ersten Fall würde einem Patienten eine tatsächlich wirksame Therapie unter Umständen vorenthalten, im zweiten Fall die Ungefährlichkeit einer Substanz behauptet, obwohl sie de facto toxisch ist. Die zweite Fehlerart wird allgemein als die gravierendere angesehen, jedenfalls dann, wenn es sich nicht um potenziell lebensrettende Therapien handelt und keine Alternativen zur Verfügung stehen, was aber bei den meisten komplexen Designs wohl eher die Ausnahme sein dürfte.
Weitgehend unabhängig von der Designfrage ist die Wahl geeigneter Outcome-Variablen und des Erfassungszeitraums bei Wirksamkeitsstudien. Ein-Gruppen-Designs, in Deutschland gerade bei komplexen Therapien leider immer noch eher die Regel als die Ausnahme, sind zum Wirksamkeitsnachweis nicht geeignet, auch wenn die „richtigen“ Ergebnisparameter (zum Beispiel klinische Endpunkte, wie etwa Überlebensraten) erhoben werden. Umgekehrt nützt die beste Randomisierungs- und Verblindungstechnik wenig, wenn so genannte Surrogatparameter (zum Beispiel EKG-„Verschönerungen“ bei einigen Antiarrhythmika) als Endpunkte herangezogen werden (24, 25).
Auch dem Vorwurf, dass die untersucherseitige Verblindung zur bloßen (somatischen) Symptomorientierung bei der Bewertung von Therapien führen müsse, versucht man seit einigen Jahren durch die zusätzliche Erfassung der Patientensicht mittels so genannter gesundheitsbezogener Lebensqualitätsskalen entgegenzutreten. Bei der Zulassung vieler Medikamente nehmen sie heute einen fast gleichberechtigten Platz neben medizinisch-somatischen Kriterien ein. Es spricht nichts dagegen, sie auch bei komplexen Therapien wie der klassischen Homöopathie einzusetzen.

zZitierweise dieses Beitrags:
Dt Ärztebl 2001; 98: A 1942–1944 [Heft 30]

Die Zahlen in Klammern beziehen sich auf das Literaturverzeichnis, das über das Internet (www.aerzteblatt.de) aufgerufen werden kann.

Anschrift der Verfasser:
Dipl.-Psych. Dr. med. Dr. phil. Peter Schuck
Dipl.-Psych. Dr. phil. Horst Müller
Prof. Dr. med. habil. Karl-Ludwig Resch
Forschungsinstitut für Balneologie
und Kurortwissenschaft
Lindenstraße 5
08645 Bad Elster


Der Beitrag „Doppelblind bei alternativen Heilverfahren“ in Heft 13/2001 stieß auf große, vor allem kritische Resonanz. Ein Aussprache-Forum mit einem Schlusswort des Autors wird in einem der nächsten Hefte folgen.
Anzeige
1. Linde K, Clausius N, Ramirez G et al.: Are the clinical effects of homeopathy placebo effects? A meta-analysis of placebo-controlled trials. Lancet 1997; 350: 834–843.
2. Cucherat M, Haugh MC, Gooch M et al.: Evidence of clinical efficacy of homeopathy. A meta-analysis of clinical trials. Eur J Clin Pharmacol 2000; 56: 27–33.
3. Jung K, Gawlik C, Gibis B et al.: Bundes­aus­schuss der Ärzte und Krankenkassen: Ansprüche der Versicherten präzisieren. Dt Ärztebl 2000; 97: A 365–370 [Heft 7].
4. Campbell M, Fitzpatrick R, Haines A et al.: Framework for design and evaluation of complex interventions to improve health. BMJ 2000; 321: 694–696.
5. Ernst E, Pittler MH: Wie effektiv ist die Kur? Eine systematische Übersicht randomisierter Studien. Dtsch Med Wochenschr 1998; 123: 273–277.
6. Schliehe F, Haaf H-G: Zur Effektivität und Effizienz der medizinischen Rehabilitation. Dt Rentenvers 1996; 10–11: 666–689.
7. Haaf H-G: Medizinische Rehabilitation bei chronischen Rückenschmerzen – Epidemiologie, Behandlungsansätze und Wirksamkeit. Dt Rentenvers 1999; 4: 235–258.
8. Brockow T, Franke A, Resch KL: Homöopathie mehr als Plazebo? Schweiz Rundsch Med Prax 1998; 87: 1687–1694.
9. Linde K, Scholz M, Ramirez G et al.: Impact of study quality on outcome in placebo-controlled trials of homeopathy. J Clin Epidemiol 1999; 52: 631–636.
10. Ivanovas G: Wissenschaftstheorie: Doppelblind bei alternativen Heilverfahren. Dt Ärztebl 2001; 98: A 822–825 [Heft 13].
11. Ernst E, Resch KL: Concept of true and perceived placebo effects. BMJ 1995; 311: 551–553.
12. Vickers AJ: Clinical trials of homeopathy and placebo: analysis of a scientific debate. J Altern Complement Med 2000; 6: 49–56.
13. Moher D, Schulz KF, Altman D: The CONSORT statement: revised recommendations for improving the quality of reports of parallel-group randomized trials. JAMA 2001; 285: 1987–1991.
14. Treasure T, MacRae KD: Minimisation: the platinum standard for trials? Randomisation doesn’t guarantee similarity of groups; minimisation does (editorial). BMJ 1998; 317: 362–363.
15. Stephenson J, Imrie J: Why do we need randomised controlled trials to assess behavioural interventions? BMJ 1998; 316: 611–613.
16. Borchgrevink G, Kaasa A, McDonagh D et al.: Acute treatment of whiplash neck sprain injuries. A randomized trial of treatment during the first 14 days after a car accident. Spine 1998: 23: 25–31.
17. Brewin C, Bradley C: Patient preference and randomised clinical trials. BMJ 1989; 299: 313–315.
18. Benson K, Hartz AJ: A comparison of observational studies and randomized, controlled trials. N Eng J Med 2000; 342: 1878–1886.
19. Concato J, Shah N, Jorwitz RI: Randomized, controlled trials, observational studies, and the hierarchy of research designs. N Eng J Med 2000; 342: 1887–1892.
20. Shadish WR, Ragsdale K: Random versus nonrandom assignment in controlled experiments: do you get the same answer? J Consult Clin Psychol 1996; 64: 1290–1305.
21. Shadish WR, Matt GE, Navarro AM et al.: The effects of psychological therapies under clinically representative conditions: a meta-analysis. Psychol Bull 2000; 126: 512–529.
22. Barton S: Which clinical studies provide the best evidence? BMJ 2000; 321: 255–256.
23. Linde K, Melchart D: Randomized controlled trials of individualized homeopathy: a state-of-the-art review. J Altern Complement Med 1998; 4: 371–388.
24. Mühlhauser I, Berger M: Surrogat-Marker: Trugschlüsse. Dt Ärztebl 1996; 93: A3280–3283 [Heft 49].
25. Mühlhauser I, Berger M: Arzneimittelsicherheit: Wirksamkeit von Medikamenten muss auch nach Zulassung geprüft werden. Dt Ärztebl 2000; 97: A 154–156 [Heft 4].

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Fachgebiet

Zum Artikel

Anzeige

Alle Leserbriefe zum Thema

Anzeige