MEDIZIN: Übersichtsarbeit

Klinische Studien zum Nachweis von Äquivalenz oder Nichtunterlegenheit

Teil 20 der Serie zur Bewertung wissenschaftlicher Publikationen

Establishing equivalence or non-inferiority in clinical trials—part 20 of a series on evaluation of scientific publications

Dtsch Arztebl Int 2012; 109(41): 674-9; DOI: 10.3238/arztebl.2012.0674

Wellek, Stefan; Blettner, Maria

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...

Hintergrund: Klinische Studien, die darauf abzielen, nachzuweisen, dass es zwischen zwei Behandlungsverfahren keine relevanten Unterschiede gibt, werden in zunehmender Anzahl durchgeführt. Für den praktizierenden Arzt vergeht kaum ein Tag, an dem er nicht zumindest indirekt von den Ergebnissen sogenannter Bio-Äquivalenzstudien Gebrauch macht. Ebenso wichtig sind aktiv kontrollierte klinische Studien, in denen die Wirksamkeit einer neuartigen Therapie durch den Nachweis der Nichtunterlegenheit gegenüber einer Standardtherapie belegt wird.

Methoden: Darstellung der Grundprinzipien und der statistischen Verfahren unter Bezugnahme auf die Originalliteratur; selektive Recherchen in der medizinischen Literatur.

Ergebnisse: Zunächst ist ein geeigneter Verteilungsparameter festzulegen, der ein sinnvolles Maß für die Unterschiedlichkeit der Behandlungswirkungen in der Grundgesamtheit darstellt. Der einfachste Ansatz für den statistischen Nachweis von Äquivalenz oder Nichtunterlegenheit beruht auf der Berechnung von Konfidenzgrenzen für diesen Parameter. Um die erforderlichen Patientenzahlen möglichst gering zu halten, empfiehlt sich auch beim Äquivalenz- und Nichtunterlegenheits-Nachweis der Einsatz von bezüglich der Trennschärfe optimierten statistischen Testverfahren.

Schlussfolgerungen: Daten aus Äquivalenz- und Nichtunterlegenheits-Studien bedürfen genauso der Signifikanzprüfung wie solche, die die Unterschiedlichkeit von Behandlungen belegen sollen. Beim Äquivalenznachweis ist es nicht zulässig, einen herkömmlichen zweiseitigen Test zu verwenden und aus einem negativen Ergebnis auf Äquivalenz zu schließen.

Bei einer klassischen randomisierten kontrollierten klinischen Studie (RCT) besteht das Ziel darin, Unterschiede zwischen zwei Behandlungen zu evaluieren (oder zwischen einer Behandlung und einem Placebo) (1). Es soll dann jeweils die Überlegenheit des neuen Behandlungsverfahrens gegenüber der Standardtherapie nachgewiesen werden. Bei Erkrankungen, für die bereits adäquate Therapien verfügbar sind, ergibt sich oft die Situation, dass ein neues Medikament entwickelt wurde, das zu geringeren Kosten erhältlich ist oder weniger Nebenwirkungen hat als existierende Präparate. In diesem Fall muss nachgewiesen werden, dass die Wirksamkeit des neuen Medikaments verglichen mit existierenden Substanzen „im wesentlichen gleich gut“ ( Äquivalenz) oder „nur unwesentlich schwächer“ ist (Nichtunterlegenheit). Eine Fragestellung vom letzteren Typ wurde beispielsweise in der CATT-Studie (Lucentis versus Avastin, [2]) angegangen, die aufgrund der Häufigkeit des zu behandelnden Krankheitsbildes (altersbedingte Makuladegeneration) und der exorbitant hohen Kosten des als nichtunterlegen nachgewiesenen Medikaments (mindestens 1 Milliarde € jährlich bei flächendeckender Anwendung allein in Deutschland) auch in der Laienpresse beträchtliches Aufsehen erregt hat (3).

Eine Äquivalenzstudie ist dadurch gekennzeichnet, dass sie durchgeführt wird, um nachzuweisen, dass es zwischen zwei (oder auch mehreren) Behandlungen keine beziehungsweise keine wesentlichen Unterschiede hinsichtlich der Wirksamkeit gibt. Bei der Planung und der Bewertung solcher Studien ist daher zunächst zu definieren, was es heißt, dass zwei Therapien „gleich gut“ sind, also welche Unterschiede als klinisch irrelevant toleriert werden können. Die klinisch relevanten Unterschiede sind im Studienprotokoll festzulegen. Dazu wird ein Parameter herangezogen, der diese Unterschiede charakterisiert. Dies kann zum Beispiel die Differenz oder der Quotient der Erwartungswerte der Zielvariablen sein. Außerdem wird eine untere und eine obere Grenze für die noch zu akzeptierende Abweichung von demjenigen Wert dieses Parameters festgesetzt, welcher bei identischer Wirksamkeit der Behandlungen vorliegt. Für die Werte dieser Äquivalenzgrenzen (englisch: equivalence margins) werden üblicherweise die Symbole -ε1 und ε2 verwendet, wobei ε1 und ε2 positive Zahlen sind. ε1 und ε2 werden unter Berücksichtigung der klinischen Fragestellung, des betrachteten klinischen Endpunkts und unter statistischen Aspekten (Form der zu beurteilenden Verteilungen) festgelegt. Handelt es sich zum Beispiel um eine Studie zum Nachweis der Äquivalenz zweier Antihypertensiva bezüglich der Reduktion des diastolischen Werts nach 4 Wochen Behandlungsdauer und wird die Differenz μ1–μ2 der mittleren Blutdrucksenkung in den Grundgesamtheiten als Zielparameter gewählt, ist ε1 = ε2 = 5 mmHg eine sinnvolle Festlegung der Äquivalenzgrenzen.

Beim Nachweis der Nichtunterlegenheit (englisch: noninferiority) soll gezeigt werden, dass die neue Therapie nicht wesentlich schlechter ist als die Referenzbehandlung. Was eine relevante Verschlechterung wäre, wird dabei festgelegt durch eine untere Schranke −ε (im Falle der mittleren Blutdrucksenkung zum Beispiel −5,0), die der zur Messung des Behandlungsunterschiedes ausgewählte Parameter ungünstigstenfalls annehmen darf.

Die Bedeutung von Äquivalenz- und Nichtunterlegenheitsstudien für die klinische Forschung hat in den letzten 2 Jahrzehnten beständig zugenommen, wie sich unter anderem an den in Grafik 1 dargestellten Trefferzahlen in PubMed für die Schlüsselwörter „bioequivalence“, „non(-)inferiority study (trial)“ und „equivalence study (trial)“ für die Jahrgänge 1991–2011 ablesen lässt. Als weiterer Indikator für diese Entwicklung kann der Anteil der auf der Basis von Äquivalenzstudien zur behördlichen Zulassung gelangten verschreibungspflichtigen Arzneimittel herangezogen werden. Nach einer in (4, § 1.4) anhand von Daten aus dem Arzneimittelreport der FDA (Food and Drug Administration der USA) vorgenommenen Hochrechnung belief sich dieser im Jahre 2008 auf nicht weniger als 78 % (Grafik 1).

Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien
Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien
Grafik 1
Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien

Unzulässigkeit des „naiven“ Ansatzes beim statistischen Testen auf Äquivalenz

Bei der Bewertung der Äquivalenz sind andere statistische Verfahren anzuwenden als in der klassischen Situation, in der die Überlegenheit gezeigt werden soll. Um auf Äquivalenz zu prüfen, führt ein herkömmlicher zweiseitiger Test (5) nicht weiter. Falsch ist nämlich, die Alternativhypothese der Äquivalenz der Behandlungen für gesichert zu erklären, wenn dieser Test ein negatives, das heißt nichtsignifikantes Ergebnis liefert. Der Fehler erster Art besteht hier ja darin, die Behandlungseffekte für ähnlich zu erklären, obwohl es relevante Unterschiede gibt. Wird also der herkömmliche Test durchgeführt, kann der Fehler erster Art bis zu 95 % betragen. Anders ausgedrückt: Nichtsignifikante Unterschiedlichkeit darf nicht mit signifikanter Übereinstimmung der Behandlungseffekte verwechselt werden. Eine unpräzisere, aber sehr häufig zitierte Formulierung für den gleichen Tatbestand lautet: „Absence of evidence is not evidence of absence“ (6).

Das Prinzip der Konfidenzintervall-Inklusion

Die konfirmatorische Auswertung von Äquivalenzstudien geschieht statistisch korrekt auf der Basis von Konfidenzintervallen. Die Grundidee hierzu ist bemerkenswert einfach und kam erstmals in Zusammenhang mit Bioäquivalenzprüfungen auf (7):

Man berechnet aus den zu analysierenden Daten eine untere Konfidenzgrenze Cu und eine obere Konfidenzgrenze Co für den ausgewählten Parameter und vergleicht diese mit den vorgegebenen theoretischen Grenzen −ε1 und ε2 . Falls das Intervall mit den Grenzen (C, Co) vollständig in dem theoretischen Intervall enthalten ist, entscheidet man für die Äquivalenzhypothese. Dies trifft genau dann zu, wenn der Wert von Cu größer wird als −ε1 und gleichzeitig derjenige von Co nicht über +ε2 hinausgeht. Andernfalls ist die Nullhypothese der Nichtäquivalenz beizubehalten. Bei der Anwendung dieser Regel (Kasten 1a) ist unbedingt folgendes zu beachten: Um zu garantieren, dass der durchzuführende Test auf Äquivalenz das Signifikanzniveau = 5 % einhält, genügt es nicht, dass das verwendete Konfidenzintervall zweiseitiges Konfidenzniveau 90 % besitzt (8). Voraussetzung ist vielmehr, dass jede der beiden Konfidenzschranken Cu und Co einseitiges Konfidenzniveau 95 % aufweist.

Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte
Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte
Kasten 1a
Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte

Will man anstatt auf Äquivalenz nur auf Nichtunterlegenheit testen, wird lediglich die untere Konfidenzgrenze benötigt. Der zugehörige Test nach dem Intervallinklusions-Prinzip läuft dann so ab, dass Nichtunterlegenheit für statistisch gesichert erklärt wird, wenn man findet, dass Cu die unter der Hypothese spezifizierte untere Äquivalenzgrenze übersteigt (Kasten 1b, Grafik 2).

Visualisierung des Vorgehens in Kasten 1a
Visualisierung des Vorgehens in Kasten 1a
Grafik 2
Visualisierung des Vorgehens in Kasten 1a
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?
Kasten 1b
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?

Optimale Tests auf Äquivalenz und Nichtunterlegenheit

Tests, die nach dem Intervalleinschlussprinzip arbeiten, kontrollieren zwar das Fehlerrisiko 1. Art, sind aber hinsichtlich der Power (10) suboptimal und benötigen daher größere Stichprobenumfänge als günstigstenfalls erforderlich.

In der statistischen Originalliteratur findet man für eine Vielzahl von Situationen, die sich nach dem Studiendesign und der Art der zu analysierenden Zielvariablen unterscheiden, optimale Tests für Äquivalenz- und Nichtunterlegenheitshypothesen (4). Die praktische Umsetzung solcher Tests ist erheblich komplizierter, als man es von herkömmlichen ein- oder zweiseitigen Signfikanztests gewohnt ist, und erfordert spezielle Berechnungsverfahren, für die aber problemlos handhabbare Computerprogramme verfügbar sind.

In Kasten 2 wird für die in klinischen Studien sehr häufige Situation des Vergleichs zweier Binomialverteilungen das optimale Verfahren der Prüfung auf Nichtunterlegenheit vorgestellt und durch ein Beispiel illustriert.

Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung
Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung
Kasten 2
Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung

Kriterien für die Beurteilung von Publikationen über Äquivalenzstudien

In Kasten 3 sind einige Grundkriterien für die Beurteilung von Publikationen über Äquivalenz- und Nichtunterlegenheitsstudien zusammengestellt. Die Tabelle enthält die Resultate einer Überprüfung dieser Kriterien in einschlägigen Publikationen der Jahrgänge 2000–2011 in den fünf wichtigsten fachübergreifenden medizinischen Zeitschriften. Danach tritt der Fehler des Schließens von nichtsignifikanten Unterschieden auf statistisch gesicherte Äquivalenz in den hochrangigen Zeitschriften nicht mehr allzu häufig auf. Weitaus weniger günstig ist das Bild bezüglich Studien mit zweiseitiger Äquivalenzfragestellung: Hier kommen anstatt optimaler Verfahren ausschließlich Konfidenzintervall-Inklusionstests zur Anwendung, und dies noch dazu in der unnötig konservativen, durch Anhebung des zweiseitigen Konfidenzniveaus auf 95 % resultierenden Version (Kasten 3, Tabelle).

Kriterien für die Beurteilung von einschlägigen Publikationen
Kriterien für die Beurteilung von einschlägigen Publikationen
Kasten 3
Kriterien für die Beurteilung von einschlägigen Publikationen
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3
Tabelle
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3

Diskussion

Tests für die konfirmatorische statistische Auswertung von Äquivalenz- und Nichtunterlegenheits-Studien gehören heute zum Standardrepertoire der medizinischen Biometrie. Ein wichtiger Anwendungsbereich für diese Verfahren ist der Nachweis der Bioäquivalenz verschiedener Formulierungen des gleichen Arzneimittels. Auf die methodischen Besonderheiten dieses Studientyps, der die Grundlage für die behördliche Zulassung von Generika bildet, konnte im Rahmen dieser kurzen Übersicht nicht näher eingegangen werden (umfassende Darstellungen findet man in Kap. 10 von [4] sowie in [12–15]). Der Äquivalenztest, der hierbei entsprechend den Guidelines der Zulassungsbehörden (vergleiche [16]) routinemäßig zur Anwendung gelangt, ist der in Kasten 1A dargestellte Test auf Äquivalenz zweier Normalverteilungen bezüglich der Differenz der Mittelwerte. Dieser ist durchzuführen mit den (logarithmisch transformierten) Quotienten der Messergebnisse aus den beiden Perioden eines Crossover-Versuchs (17).

Auch klinische Studien höherer Phasen werden in zunehmender Zahl mit dem Ziel des Äquivalenz- oder Nichtunterlegenheits-Nachweises durchgeführt. In der Mehrzahl der Fälle handelt es sich dabei um randomisierte Therapiestudien (1) mit Aktiv-(Positiv-)Kontrolle. In der Kontrollgruppe wird dann anstatt Placebo eines der als wirksam bekannten etablierten Behandlungsverfahren angewandt. Inhaltlich gesehen liegt der Hauptunterschied zu Bioäquivalenz-Studien darin, dass das Zielkriterium hier das Ansprechen von Patienten mit einschlägiger Indikation auf die Behandlung ist, nicht eine pharmakokinetische Größe, die bei gesunden Probanden gemessen wird. In statistischer Hinsicht unterscheiden sich Studien zum Nachweis therapeutischer Äquivalenz von Bioäquivalenz-Studien vor allem dadurch, dass sich der Äquivalenztest sehr oft auf Zielvariablen zu beziehen hat, die keine Verteilung vom stetigen Typ besitzen (und damit insbesondere nicht normalverteilt sind) oder teilweise zensiert sind. Besonders häufig sind in aktiv kontrollierten Therapiestudien Situationen, in denen man Vergleiche durchzuführen hat zwischen Responderraten (d. h. binomialen Proportionen) oder Kaplan-Meier-Überlebensfunktionen. Für alle diese Fragestellungen sind in der Originalliteratur geeignete Äquivalenz- und Nichtunterlegenheits-Tests verfügbar. Nach gegenwärtig vorherrschender Praxis (18) werden aktiv kontrollierte klinische Studien zumeist auf der Basis von Nichtunterlegenheits-Tests geplant und ausgewertet. Dies ist jedoch von der statistischen Logik her keineswegs zwingend, sondern begründet sich in erster Linie durch die Tatsache, dass bei gleicher Festlegung der unteren Äquivalenzgrenze und bei gegebener Power für den Nachweis von Äquivalenz im strikten Sinne erheblich größere Fallzahlen benötigt werden als für den Nichtunterlegenheits-Nachweis. In Übereinstimmung damit ist die Aussage, die bei einer positiven Testentscheidung möglich ist, beim Äquivalenznachweis sehr viel präziser als beim Nachweis von Nichtunterlegenheit.

Allgemein sollte bei der Bewertung von klinischen Studien streng darauf geachtet werden, ob es sich um eine klassische Situation oder eine Studie handelt, die zum Zwecke des Nachweises von Äquivalenz oder Nichtunterlegenheit durchgeführt worden ist. Je nach Studientyp werden andere statistische Verfahren benötigt. Tests auf Äquivalenz und Nichtunterlegenheit sind zwar mittlerweile gut entwickelt und auch bekannt, werden aber bei der Interpretation der Ergebnisse und der Begründung der Annahmen, von denen man dabei ausgeht, nicht immer in der angemessenen Weise gehandhabt. Mindestanforderungen, die Publikationen, in denen über die Ergebnisse von Äquivalenz- oder Nichtunterlegenheits-Studien berichtet wird, auf dieser Ebene erfüllen sollten, sind vor einigen Jahren in einem Addendum zum sogenannten CONSORT STATEMENT zusammengestellt worden (18).

Interessenkonflikt

Prof. Blettner erhielt Honorare für Beratertätigkeit von Astellas und AstraZeneca. Prof. Wellek erklärt, dass kein Interessenkonflikt besteht.

Manuskriptdaten
eingereicht: 12. 1. 2012, revidierte Fassung angenommen: 4. 7. 2012

Anschrift für die Verfasser
Prof. Dr. rer. nat. Maria Blettner
Institut für Medizinische Biometrie
Epidemiologie u. Informatik der
Johannes Gutenberg-Universität
Obere Zahlbacher Straße 69
55131 Mainz

blettner-sekretariat@imbei.uni-mainz.de

Zitierweise
Wellek S, Blettner M: Establishing equivalence or non-inferiority in clinical trials—part 20 of a series on evaluation of scientific publications.
Dtsch Arztebl Int 2012; 109(41): 674−9. DOI: 10.3238/arztebl.2012.0674

@The English version of this article is available online:
www.aerzteblatt-international.de

1.
Kabisch M, Ruckes C, Seibert-Grafe M, Blettner M: Randomized controlled trials: part 17 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2011; 108(39): 663–8. VOLLTEXT
2.
The CATT Research Group: Ranibizumab and Bevacizumab for Neovascular Age-Related Macular Degeneration. NEJM 2011; 364: 1897–908. CrossRef MEDLINE PubMed Central
3.
Kuhrt N: Gleiche Wirkung. Bei Altersblindheit helfen zwei Medikamente. Weiter verbreitet ist das teure. Warum? ZEIT ONLINE 2011. www.zeit.de/2011/20/Pharmaindustrie-Medikamente
4.
Wellek S: Testing statistical hypotheses of equivalence and noninferiority. 2ndedition. Boca Raton: Chapman & Hall/CRC 2010. CrossRef
5.
du Prel J, Röhrig B, Hommel G, Blettner M: Choosing statistical tests: part 12 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2010; 107(19): 343–8. VOLLTEXT
6.
Altman DG, Bland JM: Absence of evidence is not evidence of absence. BMJ 1995; 311: 485. CrossRef MEDLINE
7.
Westlake WJ: Use of confidence intervals in analysis of comparative bioavailability trials. J Pharma Sci 1972; 61: 1340–1. CrossRef MEDLINE
8.
du Prel JB, Hommel G, Röhrig B, Blettner M: Confidence interval or p-value? Part 4 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2009; 106(19): 335–9. VOLLTEXT
9.
Hilgers R-D, Bauer P, Schreiber V, Heitmann KU: Einführung in die Medizinische Statistik. 2nd edition. Berlin: Springer-Verlag 2007. CrossRef
10.
Röhrig B, du Prel JB, Wachtlin D, Kwiecien R, Blettner M: Sample size calculation in clinical trials: part 13 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2010; 107(31–32): 552–6. VOLLTEXT
11.
Eron JJ, Young B, Cooper DA, et al.: SWITCHMRK 1 and 2 investigators: Switch to a raltegravir-based regimen versus continuation of a lopinavir-ritonavir-based regimen in stable HIV-infected patients with suppressed viraemia (SWITCHMRK 1 and 2): two multicentre, double-blind, randomised controlled trials. Lancet 2010 30; 375: 396–407. Epub 2010 Jan 12. PubMed PMID: 20074791. CrossRef MEDLINE
12.
Vollmar J (Ed.): Bioäquivalenz sofort freisetzender Arzneiformen. Stuttgart: Gustav Fischer Verlag 1991. CrossRef
13.
Chow SC, Liu JP: Design and Analysis of Bioavailability and Bioequivalence Studies, 3rdEdition. Boca Raton: Chapman & Hall/CRC 2008. CrossRef
14.
Patterson S, Jones B: Bioequivalence and Statistics in Clinical Pharmacology. Boca Raton: Chapman & Hall/CRC Press 2005. CrossRef
15.
Hauschke D, Steinijans VW, Pigeot I: Bioequivalence Studies in Drug Development: Methods and Applications. Chichester: John Wiley & Sons 2007. CrossRef
16.
Food and Drug Administration (FDA): Guidance for industry: Statistical approaches to establishing bioequivalence. Rockville, MD: Center for Drug Evaluation and Research (CDER) 2001.
17.
Wellek S, Blettner M: On the proper use of the crossover design in clinical trials: part 18 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2012; 109(15): 276–81. VOLLTEXT
18.
Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ, for the CONSORT Group: Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement. JAMA 2006; 295: 1152–60. CrossRef MEDLINE
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universitätsklinikum Mainz:
Prof. Dr. rer. nat. Wellek, Prof. Dr. rer. nat. Blettner
Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien
Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien
Grafik 1
Ergebnisse einer Literaturrecherche zur Häufigkeit von Äquivalenzsstudien
Visualisierung des Vorgehens in Kasten 1a
Visualisierung des Vorgehens in Kasten 1a
Grafik 2
Visualisierung des Vorgehens in Kasten 1a
Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte
Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte
Kasten 1a
Durchführung des Intervallinklusions-Tests auf Äquivalenz von zwei Normalverteilungen bezüglich der Differenz der Mittelwerte
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?
Kasten 1b
Was ändert sich, wenn in der Situation aus Kasten 1A anstatt auf Äquivalenz auf Nichtunterlegenheit getestet wird?
Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung
Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung
Kasten 2
Test auf Nichtunterlegenheit bezüglich der Odds Ratio in Zweiarm-Studien mit dichotomer Response-Beurteilung
Kriterien für die Beurteilung von einschlägigen Publikationen
Kriterien für die Beurteilung von einschlägigen Publikationen
Kasten 3
Kriterien für die Beurteilung von einschlägigen Publikationen
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3
Tabelle
Verteilung der Pro’s und Con’s gemäß (Q1)–(Q5) aus Kasten 3
1.Kabisch M, Ruckes C, Seibert-Grafe M, Blettner M: Randomized controlled trials: part 17 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2011; 108(39): 663–8. VOLLTEXT
2.The CATT Research Group: Ranibizumab and Bevacizumab for Neovascular Age-Related Macular Degeneration. NEJM 2011; 364: 1897–908. CrossRef MEDLINE PubMed Central
3.Kuhrt N: Gleiche Wirkung. Bei Altersblindheit helfen zwei Medikamente. Weiter verbreitet ist das teure. Warum? ZEIT ONLINE 2011. www.zeit.de/2011/20/Pharmaindustrie-Medikamente
4.Wellek S: Testing statistical hypotheses of equivalence and noninferiority. 2ndedition. Boca Raton: Chapman & Hall/CRC 2010. CrossRef
5.du Prel J, Röhrig B, Hommel G, Blettner M: Choosing statistical tests: part 12 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2010; 107(19): 343–8. VOLLTEXT
6. Altman DG, Bland JM: Absence of evidence is not evidence of absence. BMJ 1995; 311: 485. CrossRef MEDLINE
7.Westlake WJ: Use of confidence intervals in analysis of comparative bioavailability trials. J Pharma Sci 1972; 61: 1340–1. CrossRef MEDLINE
8.du Prel JB, Hommel G, Röhrig B, Blettner M: Confidence interval or p-value? Part 4 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2009; 106(19): 335–9. VOLLTEXT
9.Hilgers R-D, Bauer P, Schreiber V, Heitmann KU: Einführung in die Medizinische Statistik. 2nd edition. Berlin: Springer-Verlag 2007. CrossRef
10.Röhrig B, du Prel JB, Wachtlin D, Kwiecien R, Blettner M: Sample size calculation in clinical trials: part 13 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2010; 107(31–32): 552–6. VOLLTEXT
11.Eron JJ, Young B, Cooper DA, et al.: SWITCHMRK 1 and 2 investigators: Switch to a raltegravir-based regimen versus continuation of a lopinavir-ritonavir-based regimen in stable HIV-infected patients with suppressed viraemia (SWITCHMRK 1 and 2): two multicentre, double-blind, randomised controlled trials. Lancet 2010 30; 375: 396–407. Epub 2010 Jan 12. PubMed PMID: 20074791. CrossRef MEDLINE
12.Vollmar J (Ed.): Bioäquivalenz sofort freisetzender Arzneiformen. Stuttgart: Gustav Fischer Verlag 1991. CrossRef
13.Chow SC, Liu JP: Design and Analysis of Bioavailability and Bioequivalence Studies, 3rdEdition. Boca Raton: Chapman & Hall/CRC 2008. CrossRef
14.Patterson S, Jones B: Bioequivalence and Statistics in Clinical Pharmacology. Boca Raton: Chapman & Hall/CRC Press 2005. CrossRef
15.Hauschke D, Steinijans VW, Pigeot I: Bioequivalence Studies in Drug Development: Methods and Applications. Chichester: John Wiley & Sons 2007. CrossRef
16.Food and Drug Administration (FDA): Guidance for industry: Statistical approaches to establishing bioequivalence. Rockville, MD: Center for Drug Evaluation and Research (CDER) 2001.
17.Wellek S, Blettner M: On the proper use of the crossover design in clinical trials: part 18 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2012; 109(15): 276–81. VOLLTEXT
18.Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ, for the CONSORT Group: Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement. JAMA 2006; 295: 1152–60. CrossRef MEDLINE

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Alle Leserbriefe zum Thema

Login

Loggen Sie sich auf Mein DÄ ein

E-Mail

Passwort

Anzeige