SucheTrefferlisteProstatakarzinom-Studie: PREFERE aus der Retrospektive

MEDIZINREPORT

Prostatakarzinom-Studie: PREFERE aus der Retrospektive

Dtsch Arztebl 2017; 114(25): A-1243 / B-1032 / C-1010

Wellek, S.; Martus, P.; Wiegel, T.; Stöckle, M.

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...

Was waren die echten und was die angeblichen Probleme? Für ähnlich ambitionierte Studien lässt sich aus dem Scheitern eine Lehre ziehen.

Radiotherapie des Prostatakarzinoms: Die Strahlung konvergiert im anvisierten Tumor (in rosa markiert). Foto: Science Photo Library/Antonia Reeve

Das PREFERE-Studienprojekt, für das die Patientenneuaufnahme Ende vergangenen Jahres wegen Nichterreichbarkeit des Rekrutierungsziels gestoppt wurde, hatte zum Ziel, 4 Therapieoptionen für das lokoregionäre Prostatakarzinom (PCA) mit niedrigem und frühem intermediären Risiko (Radikale Prostatektomie, Perkutane Strahlentherapie, Permanente Seed Implantation [Brachytherapie] und Active Surveillance) vergleichend zu evaluieren. An dem Projekt, das eigentlich ein Meilenstein der klinischen Krebsforschung in Deutschland hätte werden sollen, haben sich die Geister nach anfänglicher breiter Zustimmung mit außergewöhnlicher Heftigkeit geschieden.

Ziel des vorliegenden Beitrags ist es, die Vorbehalte, die dabei geäußert wurden, auf ihren wissenschaftlich-methodischen Kern zu reduzieren, und die Frage, wie man die Akzeptanz und die Realisierungsaussichten eines Therapiestudienprojekts von gleicher Ambitioniertheit und Komplexität relevant verbessern könnte, zumindest einer Teilantwort näherzubringen.

Die Haupteinwände gegen das methodische Konzept von PREFERE bezogen sich auf die folgenden Grundkomponenten bzw. behaupteten Schwachpunkte des Studienprotokolls:

(1) Noninferiority statt Nachweis von Überlegenheit

(2) Inadäquate Festlegung des zu tolerierenden Wirksamkeitsverlusts bei Verbesserung der Lebensqualität

(3) Nichtberücksichtigung von Erkenntnissen aus anderen Studien

(4) Ungeeignetheit des primären Endpunktes wegen exzessiv langer Studiendauer

ad (1): Anders als in etlichen mündlichen Diskussionen über das PREFERE-Projekt geäußert, sind Nichtunterlegenheitsstudien durchaus nichts Exotisches, sondern ein in der wissenschaftlichen Medizin fest eingebürgerter Studientyp, der in den letzten Jahren massiv an Bedeutung gewonnen hat (für empirische Daten hierzu s. 1, Grafik 1). Aus Gründen, die keiner näheren Erläuterung bedürfen, war das Testen gegen eine Negativkontrolle (typischerweise Plazebo) im Kontext der PREFERE-Studie definitiv keine Option. Die Vorstellung, dass eine der 3 nicht- bzw. schwach-invasiven Behandlungsmodalitäten der radikalen Prostatektomie hinsichtlich der Wirksamkeit überlegen sein könnte, war unrealistisch. In einer solchen Ausgangssituation gibt es, falls eine kontrollierte randomisierte Therapiestudie zu planen ist, zum Nichtunterlegenheitsdesign keine sinnvolle Alternative.

Der Preis für Verbesserungen

ad (2): Die Festlegung des Wirksamkeitsverlusts gegenüber der Referenztherapie, den man als Preis für substanzielle Verbesserungen der Lebensqualität und anderer Verträglichkeitsendpunkte zu akzeptieren bereit ist, ist grundsätzlich in jeder Nichtunterlegenheitsstudie ein kontrovers diskutiertes Thema. Die in der PREFERE-Studie vorgenommene Festlegung war das Ergebnis eines langen und sorgfältigen Konsensfindungs-Prozesses und wurde von keinem der im Vorfeld mit der Begutachtung des Projekts betrauten Experten aus dem In- und Ausland für kritikwürdig befunden.

Die in (2) formulierte Behauptung, in der PREFERE-Studie wäre eine Therapie mit 154 Todesfällen gegenüber einer Therapie mit 100 derartigen Ereignissen als nicht unterlegen angesehen worden, ist falsch. Der Fehler besteht in der Gleichsetzung des sogenannten Hazard-Quotienten mit einem Quotienten von Sterbewahrscheinlichkeiten. Jedoch sind beide Begriffe mathematisch völlig unterschiedlich definiert.

ad (3): Zu den Hauptfragestellungen von PREFERE gab es in der Literatur zum Zeitpunkt der Planung des Projekts keine Erkenntnisse, die methodisch zufriedenstellende Evidenzgrade hätten beanspruchen können. Hieran hat sich bis heute nichts geändert. Die Ende 2016 publizierte ProtecT- Studie (3) war mit dem Ziel des Nachweises von Unterschieden zwischen den Behandlungsmodalitäten geplant worden und hatte, bezogen auf ihre Ausgangshypothesen, ein Negativresultat. Eine Uminterpretation dieses Ergebnisses als gelungener Nachweis der Gleichwertigkeit der Behandlungsoptionen wäre statistisch-methodisch bekanntermaßen (vgl. z. B. 1) unzulässig und wurde von den Autoren dement-sprechend konsequent vermieden.

ad (4): Dass die PREFERE-Studie mit einer maximal möglichen Nachbeobachtungszeit von 17 Jahren hinsichtlich der Projektdauer einen Extremfall darstellt, ist unstrittig und war auch im verantwortlichen Steering Committee stets so gesehen worden. In der ursprünglich dem internationalen Gutachtergremium eingereichten Version des Projekts wäre die Laufzeit 4 Jahre kürzer gewesen. Die Verlängerung wurde notwendig, um die Auflage der Gutachter zu Abänderung des primären Endpunkts (ursprünglich definiert als Zeit bis zum Tumorprogress nach erster Hormontherapie) erfüllen zu können. Kaum zu bestreiten ist dabei, dass es für diese Gutachterempfehlung klare methodische Gründe gab: Der ursprünglich vor-gesehene Endpunkt hängt vom Zeitpunkt der Einleitung der Hormontherapie ab, welche in den einzelnen Therapiearmen unterschiedlich gehandhabt wird. Die hieraus resultierende Beobachtungsungleichheit würde zu verzerrten Schätzungen des Unterschiedes zwischen den Verteilungen der ereignisfreien Zeiten führen.

Rekrutierung war erschwert

Wesentlich uneinheitlicher als die retrospektive Beurteilung des methodischen Grundkonzepts von PREFERE fällt eine Analyse der Hürden für die praktische Machbarkeit des Projekts aus. Ganz besonders hinderlich für das Erreichen des Rekrutierungsziels im protokollgemäßen Zeitrahmen haben sich folgende Tatbestände ausgewirkt:

(i) Restriktive Einschlusskriterien

(ii) Unsicherheit über Ziele und Notwendigkeit der Studie bei einer beträchtlichen Anzahl von Urologen

(iii) Fehlen einer überzeugenden und effektiven Strategie zur Förderung der Bereitschaft, randomisierte Therapieentscheidungen zu akzeptieren

ad (i): Der Anteil an Patienten mit Erstdiagnose eines Prostatakarzinoms von höchstens intermediärem Risiko, bei denen die Einschlusskriterien im Endeffekt nicht verifiziert werden konnten, erwies sich als erheblich höher als erwartet. Dies war vor allem ein – nur scheinbar paradoxer – Effekt der Qualitätssteigerung der Diagnostik durch Einrichtung einer Referenzpathologie für die histologische Zweitbegutachtung der Stanzbiopsien bei allen von den einzelnen Studienzentren für die Rekrutierung in PREFERE angemeldeten Patienten.

Kampagne als Hemmschuh

ad (ii): Ohne die vom Prinzip her wenig erhellenden Details nochmals rekapitulieren zu wollen, bleibt festzustellen, dass gegen die PREFERE-Studie in der urologischen Fachpresse unter Ignorierung der Tatsache, dass das Projekt einen aufwendigen Reviewprozess durch international ausgewiesene Kliniker und Methodiker längst erfolgreich durchlaufen hatte, eine regelrechte Medienkampagne entfacht wurde.

Es liegt auf der Hand, dass ohne diesen bereits unter formalen Aspekten äußerst ungewöhnlichen Vorgang die Bereitschaft zur aktiven Beteiligung an dem Projekt innerhalb der urologischen Community eine wesentlich höhere gewesen wäre, als sie trotz aller Bemühungen zur Gegensteuerung und Richtigstellung tatsächlich erreicht wurde.

ad (iii): Für die Machbarkeit jedes RCT (Randomized Clinical Trial) ist von ausschlaggebender Bedeutung, dass ein genügend hoher Anteil von jenen Patienten, die die Einschlusskriterien erfüllen, dazu motiviert ist, eine Therapieentscheidung zu akzeptieren, die nicht aufgrund gezielter ärztlicher Empfehlung, sondern nach dem Zufallsprinzip erfolgt. Die Schwierigkeiten, die es auf dieser Ebene in der PREFERE-Studie gab, waren gegenüber dem Standardfall einer Studie zum Vergleich verschiedener Medikamente aufgrund der extremen Unterschiedlichkeit der zu prüfenden Therapiemodalitäten erheblich gesteigert.

Wenn wir uns rückschauend fragen, welche Lehren man aus dem Scheitern von PREFERE zu ziehen hat, ist unsere Antwort eindeutig: Es genügt nicht, ein von der Fragestellung her klinisch hoch relevantes, methodisch ausgefeiltes Studienprotokoll zu erarbeiten, solange keine effiziente Strategie dafür vorhanden ist, sowohl die Ärzte der involvierten Fachdisziplinen als auch die Patienten für eine Mitwirkung an dem Projekt zu gewinnen. Was die Patientenseite betrifft, handelt es sich bei der Frage, wie man eine ausreichende Akzeptanz randomisierter Therapiezuweisungen sicherstellen kann, unseres Erachtens um ein immer wieder neu zu lösendes Problem von grundsätzlicher Tragweite für die gesamte klinische Therapieforschung. Unseres Wissens existieren zu diesem Thema bisher keine durch belastbare empirische Daten abgesicherten Erkenntnisse. Wenn die Erfahrungen der PREFERE-Studie den Anstoß für ein entsprechendes Forschungsprojekt mit positivem, in der Praxis umsetzbarem Ergebnis liefern würde, wäre das ein beträchtlicher Gewinn auch für viele andere Disziplinen.

Prof. Dr. rer. nat. S. Wellek
Abt. Biostatistik, ZI Mannheim/Universität
Heidelberg & Inst. f. Med. Biometrie, Epidemio-
logie und Informatik, Universitätsmedizin der
Johannes Gutenberg-Universität Mainz

Prof. Dr. rer. nat. P. Martus
Inst. f. Klinische Epidemiologie
und angewandte Biometrie, Universität Tübingen

Prof. Dr. med. T. Wiegel
Klinik für Strahlentherapie,
Universitätsklinikum Ulm

Prof. Dr. med. M. Stöckle
Klinik für Urologie,
Universitätsklinikum Homburg/Saar

1.
Wellek S, Blettner M: Klinische Studien zum Nachweis von Äquivalenz oder Nichtunterlegenheit: Teil 20 der Serie zur Bewertung wissenschaftlicher Publikationen. Dtsch Arztebl Int 2012; 109 (41), 674–9 VOLLTEXT
2.
Porzsolt F: Prostatakrebs-Studie – Keine Schuldzuweisung. Leserforum. Deutsches Ärzteblatt | Jg. 114 | Heft 5 |3. Februar 2017 VOLLTEXT
3.
Hamdy FC, Donovan JL, Lane JA, et al. for the ProtecT Study Group: 10-year outcomes after monitoring, surgery, or radiotherapy for localized prostate cancer. NJEM 2016: 375 (15), 1415–24 CrossRef MEDLINE
1. Wellek S, Blettner M: Klinische Studien zum Nachweis von Äquivalenz oder Nichtunterlegenheit: Teil 20 der Serie zur Bewertung wissenschaftlicher Publikationen. Dtsch Arztebl Int 2012; 109 (41), 674–9 VOLLTEXT
2. Porzsolt F: Prostatakrebs-Studie – Keine Schuldzuweisung. Leserforum. Deutsches Ärzteblatt | Jg. 114 | Heft 5 |3. Februar 2017 VOLLTEXT
3.Hamdy FC, Donovan JL, Lane JA, et al. for the ProtecT Study Group: 10-year outcomes after monitoring, surgery, or radiotherapy for localized prostate cancer. NJEM 2016: 375 (15), 1415–24 CrossRef MEDLINE

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

ManfredJohannsen
am Dienstag, 27. Juni 2017, 17:17

Statistische Hypothese des primären Endpunktes leider nicht offengelegt

In der Nachbetrachtung der PREFERE-Studie wird ein wichtiger Einwand gegen das Studienkonzept leider nicht genannt: die für die Fallzahlplanung zugrundegelegte Ereignisrate. Immerhin war das Prostatakarzinom-spezifische Überleben der primäre Endpunkt der PREFERE-Studie. Die statistische Hypothese dazu wurde jedoch nicht veröffentlicht. Eine im Internet abrufbare Kurzversion des Prüfplans enthielt keine Nennung der Ereignisrate. Ausser einer Präsentation auf dem Urologenkongress 2012 war es der interessierten Öffentlichkeit mit Ausnahme weniger Ärzte und Krankenkassenvertreter nicht möglich, diese Fragestellung zu überprüfen bzw. mit aktueller Literatur zu vergleichen. Die Studienleiter haben sich in mehreren Stellungnahmen über angeblich unberechtigte Kritik an ihrer Studie mit dem Hinweis beschwert, die Kritiker hätten in Ermangelung des ausführlichen Studienprotokolls das Studiendesign nicht verstanden (1,2). Warum wurde der komplette Prüfplan dann nicht zur Verfügung gestellt?
Bereits vor Beginn der Studie, spätestens jedoch seit der von den Autoren erwähnten ProtecT-Studie (3), die eine krebsspezifische Mortalität nach 10 Jahren von nur knapp 1% berichtete, drängte sich der Verdacht auf, dass die PREFERE-Studie selbst bei optimaler Rekrutierung aufgrund einer zu hoch geschätzten Ereignisrate keine signifikanten Ergebnisse hätte liefern können. Diesen einfachen Zusammenhang versteht im Übrigen jeder niedergelassene Urologe und die Studienleiter hätten durch eine Adressierung dieser Frage Vertrauen wiederherstellen können. Stattdessen hat die konsequente Nicht-Nennung der angenommenen Prostatakarzinom-spezifischen Mortalität als Grundlage der Fallzahlschätzung der PREFERE-Studie, zusammen mit dem Vorwurf der Forschungsverweigerung an die niedergelassenen UrologInnen, das Misstrauen gegenüber der Studie noch verstärkt.
Ich würde die Gründe für das Scheitern der PREFERE-Studie gern für meinen persönlichen Erkenntnisgewinn und für das Vertrauen in zukünftige akademische Forschungsprojekte verstehen. Könnte mir jemand der Studienleiter, der eingeweihten Fachgesellschaften oder Berufsverbände bitte den PREFERE-Prüfplan zur Verfügung stellen?

PD Dr. med. Manfred Johannsen, F.E.B.U.
Arzt für Urologie und Andrologie
Medikamentöse Tumortherapie
Carl-Schurz-Str. 31
13597 Berlin

1 Wiegel T et al, Prostatakarzinom: PREFERE-Studie – Eine Standortbestimmung
Dtsch Arztebl 2015; 112(37): [25]; DOI: 10.3238/PersUro.2015.0911.06
2 Wiegel T, Albers P, Bussar-Maatz R et al (2013) PREFERE – die Deutsche Prostatakrebsstudie. Fragen und Behauptungen rund um den Studienbeginn im Januar 2013. Urologe 52:576–579
3 Hamdy FC, Donovan JL, ProtecT Study Group et al (2016) 10-year outcomes after
monitoring, surgery, or radiotherapy for localized prostate cancer. N Engl J Med
375(15):1415–1424.