MEDIZIN: Originalarbeit
Beurteilung von Therapien mit der „number needed to treat“
Assessing the Efficacy of Treatments Using Number Needed to Treat


Einleitung: Aggressive Werbekampagnen der pharmazeutischen Industrie sowie Autoren und Zeitschriften betonen häufig prozentuale Risikominderungen durch Arzneimittel. Diese Aussagen werden durch die „number needed to treat“ (NNT) relativiert, die jedoch auch Fallgruben sind. Methoden: Einfache mathematische Überlegungen und Diskussion ausgewählter Literatur. Ergebnisse: Ohne weitere Informationen kann die NNT zu falschen Schlussfolgerungen führen. Beim Vergleich kontrollierter klinischer Studien kann die NNT nur dann über die wirksamere Behandlung Auskunft geben, wenn das Ausgangsrisiko in den Untersuchungen vergleichbar ist. Anhand dieses Basisrisikos kann die kleinstmögliche NNT berechnet werden. Zudem muss die NNT auf Behandlungszeiträume normiert werden. Die Schwierigkeiten bei der Interpretation von Ergebnissen werden anhand von Studien mit Antihypertensiva veranschaulicht. Diskussion: Das Verhältnis der kleinstmöglichen NNT zur tatsächlichen NNT sollte als Dilutionsfaktor angegeben werden. Dieser kann auch als Kehrwert der relativen Risikoreduktion berechnet werden. Nicht nur durch eine wirksame Therapie, sondern auch durch eine sorgfältige Diagnostik kann die NNT gesenkt werden. Dtsch Arztebl 2006; 103(48): A 3254–8.
Schlüsselwörter: Arzneimittelwirksamkeit, klinische Prüfung, Therapiestudie, Gesundheitsökonomie, „number needed to treat“
Summary
Assessing the efficacy of treatments using number needed to treat
Introduction: Aggressive pharmaceutical industry advertising, as well as authors and journals, often emphasise a relative risk reduction. These results can be adjusted by the number needed to treat. Methods: Simple mathematical considerations and selective literature review. Results: Without any further information, NNT can be misleading.
In controlled clinical trials, the NNT identifies the superior treatment correctly if the background risks are comparable. From this background risk the smallest possible NNT can be calculated. In addition, NNT must be adjusted for duration of treatment. The difficulties in assessing outcomes are exemplified by studies on antihypertensives. Discussion: The ratio between the smallest possible NNT and the calculated NNT should be mentioned (factor of dilution). Not only therapeutic efficay but also diagnostic accuracy can reduce the NNT.
Dtsch Arztebl 2006; 103(48): A 3254–8.
Key words: drug efficacy, clinical evaluation, study, health economics, number needed to treat
Ein Medikament oder eine Behandlungsmethode sind umso erfolgreicher, je häufiger durch die Intervention das gewünschte Ziel erreicht wird. Dies wird mit der „number needed to treat“ (NNT) ausgedrückt (Kasten 1). Idealerweise sollte diese Zahl eins sein. Nur dann haben ausschließlich Patienten, die von einer Behandlung profitieren, auch das Risiko unerwünschter Wirkungen zu tragen. Bei Akuterkrankungen dürften Behandlungsmethoden nicht lange Bestand haben, wenn sie nicht wenigstens bei jedem Dritten oder Vierten (entspricht einer NNT von 3 oder 4) zum Erfolg führen. In der präventiven Behandlung von asymptomatischen Patienten, aber auch bei der Betreuung Schwerkranker kann im Einzelfall nicht gesagt werden, ob durch die Behandlung beispielsweise ein Schlaganfall verhindert oder das Leben verlängert werden konnte.
Im Folgenden werden Fallgruben bei der Beurteilung von NNT und relativen Risiken beschrieben sowie am Beispiel von Studien zu Antihypertensiva der Zusammenhang zwischen Basisrisiko und NNT erläutert. Darüber hinaus wird ein Vorschlag zu einer erweiterten Angabe der NNT unterbreitet und Möglichkeiten zur Reduktion von NNT durch intensivere Diagnostik aufgezeigt.
NNT kontra relative Risikoreduktion
In kontrollierten Studien und Metaanalysen werden die Risiken (oder Versagerquoten) von Behandlungen geschätzt und miteinander verglichen. Wenn bei gleich vielen Patienten in zwei größeren Vergleichsgruppen unter den Nichtbehandelten 100, bei Behandlung aber nur 80 Patienten erkranken, bedeutet dies ein relatives Risiko von 0,8. Man kann dies auch als 20-prozentige Risikominderung ausdrücken; dies erscheint eindrucksvoller. Bei einer Angabe von 0,8 bedarf es einer weiteren Erklärung: Bei 20 Prozent Risikominderung gehen viele davon aus, dass bei Nichtbehandlung alle erkranken, durch die Behandlung dagegen etwa jeder Fünfte davor bewahrt werden kann (1, 2). Dieser Trugschluss wird häufig für Werbestrategien der pharmazeutischen Industrie genutzt.
Welche Bedeutung hat die Angabe der absoluten Risiken mit und ohne Behandlung? Im genannten Beispiel mit einer relativen Risikoreduktion (RRR) von 20 Prozent könnten sie zum Beispiel 50 Prozent (100 von 200) bei Unbehandelten und 40 Prozent (80 von 200) bei Behandelten, aber auch 5 Prozent (100 von 2 000) und 4 Prozent (80 von 2 000) betragen. Dann müssten aber nicht nur fünf Patienten behandelt werden, um ein Ereignis zu vermeiden, sondern zehn oder sogar 100. Die NNT scheint die beste Auskunft über den Wert einer Therapie zu geben und wird großzügig für Vergleiche zwischen medikamentösen und nichtmedikamentösen Therapien herangezogen und verteidigt (3), sogar bei Vergleichen differierender Untergruppen in Fall-Kontroll-Studien. Man nimmt an, dass sich die kleinere NNT bei der wirkungsvolleren Behandlung ergibt. Dies ist jedoch nicht der Fall, wenn die Vergleiche nicht statthaft sind, wie im Folgenden erläutert wird.
Beziehung von Wirksamkeit und NNT
Ein ideales Medikament könnte in allen Fällen ein bestimmtes Krankheitsereignis verhindern, das beispielsweise bei zwei Prozent einer Population auftritt. Die NNT zur Behandlung mit diesem Medikament beträgt 50. Da man nicht weiß, welche zwei Personen von der Krankheit bedroht sind, müssen alle behandelt werden. Bei einem Erkrankungsrisiko von 5 Prozent würde die NNT bei derselben Behandlung auf 20 sinken (Grafik 1a). Nur wenn bei Nichtbehandlung bei allen 100 Patienten das Krankheitsereignis auftritt (zum Beispiel Tod bei Nichtdialyse von terminal Nierensuffizienten), beträgt die NNT 1.
Bei ausschließlicher Betrachtung der NNT kann leicht Gleichwertigkeit von Therapien vorgetäuscht werden: Eine Patientengruppe mit einem Erkrankungsrisiko wird mit einem Medikament behandelt, das nur bei jedem zweiten das Krankheitsereignis verhindert. Am Ende der Behandlung wären in der Verumgruppe fünf Prozent erkrankt, unter Placebo zehn Prozent, dies ergibt eine NNT von 20 (Grafik 1b). Dies ist die gleiche NNT wie bei einem weit besseren Medikament (Grafik 1a), wenn dieses bei Patienten mit einem fünfprozentigen Risiko angewendet wird.
Die NNT steigt sowohl mit abnehmender Wirksamkeit von Behandlungen als auch mit sinkendem Basisrisiko der Behandelten. Der folgende Vergleich der Ergebnisse zweier placebokontrollierter Studien zeigt, wie unterschiedliche Basisrisiken zu unterschiedlichen NNT führen können. Zwei Hypertoniestudien an älteren Patienten ergaben NNT von 175 und 71 für die Vermeidung eines Schlaganfalls. In der SYST-EUR-Studie testeten die Wissenschaftler einen Calciumantagonisten, in der STOP-Untersuchung ein Diuretikum und einen Betablocker (10). In der ersten Studie betrug das Schlaganfallrisiko 1,39 pro 100 Patientenjahre und sank auf 0,82, in STOP 3,1 pro 100 Patientenjahre und verminderte sich auf 1,7. Die kleinstmögliche NNT betrug in SYST-EUR 72, in der zweiten dagegen 32, sodass die Chancen für eine niedrige NNT in der zweiten deutlich größer waren als in der ersten. Das Verhältnis von tatsächlicher zu minimal möglicher NNT war mit 2,4 und 2,2 etwa gleich. Anders ausgedrückt: Bei der Verhinderung eines Schlaganfalles kann trotz niedriger NNT in der STOP-Studie eine Diuretika- beziehungsweise Betablockertherapie nicht als eine der Behandlung mit dem Calciumantagonisten überlegene Behandlung angesehen werden.
NNT in Studien mit Antihypertensiva
NNT sind damit nicht wertlos. Die gewählten Beispiele belegen lediglich die Abhängigkeit der NNT vom Risiko der Patienten, wenn sie nicht behandelt werden, also vom Basisrisiko. Dessen praktische Bedeutung für die NNT zeigt sich zum Beispiel in weiteren Untersuchungen mit Antihypertensiva (Grafik 2). Ausgewertet wurden Studien, die bis 2003 publiziert wurden (8) und in denen schwerere kardiovaskuläre Ereignisse zusammengenommen ausgewertet wurden. Um die berechneten NNT besser vergleichen zu können, werden sie hier bei zeitlich weitgehend konstanter Zunahme des Nutzens der Therapie auf ein Jahr normiert. Die NNT weisen eine große Streuung auf; es wurde deshalb ein halblogarithmischer Maßstab gewählt. Zusätzlich dargestellt sind für jede Studie die kleinstmöglichen NNT (NNTmin), die sich rechnerisch (Kasten 1) aus dem Risiko in der Placebogruppe ergeben.
Intuitiv bewertet man eine Therapie als besonders wirkungsvoll, bei der tatsächliche und kleinstmögliche NNT gleich sind. Bei Betrachtung der Grafik 2 fällt auf, dass dies manchmal fast erreicht wird, aber im mittleren Risikobereich weisen die tatsächlichen NNT einen relativ konstanten Abstand zu den jeweils kleinstmöglichen NNT auf. Dieser Abstand entspricht – wegen der logarithmischen Darstellung – einem Faktor, mit dem die kleinstmögliche NNT multipliziert werden kann, um die tatsächliche NNT zu erhalten.
Im Folgenden werden die NNT einzelner Studien verglichen, in denen außer den Basisrisiken weitere Unterschiede in den Patientenkollektiven und den Studienbedingungen nicht berücksichtigt werden. Therapie A und B erfolgten bei Patienten mit etwa gleichem Risiko. Die höhere NNT bei Therapie A weist auf die Unterlegenheit im Vergleich zu Therapie B hin. In den Studien C und D unterschied sich das Risiko der Patienten um den Faktor 5. Obgleich die NNT in beiden Studien etwa gleich war, ist Therapie D mit großer Wahrscheinlichkeit schlechter. Schwieriger ist die Entscheidung bei der höheren NNT für B im Vergleich zu E mit einer sehr ähnlichen Differenz zur jeweils kleinstmöglichen NNT. Weil E bei Patienten mit einem etwa 1,5fach größeren Risiko als B angewandt wurde, sollten B und E in einer neuen kontrollierten Studie, das heißt bei Patienten mit gleichem Risiko, miteinander verglichen werden. Es erscheint auch nicht gerechtfertigt, zum Beispiel die in der Studie C erfolgte Behandlung etwa deswegen abzulehnen, weil ihre NNT über einer willkürlichen Grenze – hier von 100 pro Jahr – liegt. Wahrscheinlich sinkt die NNT für C bei einem höheren Ausgangsrisiko der Patienten deutlich. Der Wert einer Therapie sollte also nicht nur nach der NNT beurteilt, sondern auch an dem Verhältnis von tatsächlicher zu kleinstmöglicher NNT gemessen werden. Dieses Verhältnis ist ein mathematisches Äquivalent der relativen Risikoreduktion.
Erweiterte Angabe von NNT und Grenzen der Aussagekraft
Die Beispiele verdeutlichen, dass die alleinige Angabe der NNT für den Wirksamkeitsvergleich unterschiedlicher Behandlungen nicht ausreicht, auch wenn die NNT wie in Grafik 2 auf einen bestimmten Zeitraum normiert werden. Dies ist aber nicht in jedem Fall statthaft. Entscheidender kann das Verhältnis von kleinstmöglicher NNT zu tatsächlicher NNT sein. Diese Zahl, die als Dilutionsfaktor bezeichnet werden kann, sollte mit angegeben werden. Für Grafik 1b ergibt sich beispielsweise:
NNT: 100/(10–5) = 20, kleinstmögliche NNT
(NNTmin): 100/10 = 10, Dilutionsfaktor: 20/10 = 2.
Die erweiterte Angabe der NNT kann somit 20/2 lauten (Kasten 1); dies zeigt unter anderem, dass 20/2 auch als Division gelesen werden kann, dessen Lösung dann die kleinstmögliche NNT ergibt. Je mehr sich die Zahl hinter dem Schrägstrich der 1 nähert, umso besser ist die Wirksamkeit einer Therapie, weil die in einer Studie ermittelte tatsächliche NNT der kleinstmöglichen nahe kommt. So steht die Wirksamkeit eines Verfahrens mit einer NNT von 10 000/1 (zum Beispiel einer Impfaktion) außer Frage. Die Anwendung hängt vor allem vom Nutzen-Schaden-Verhältnis und den ökonomischen Voraussetzungen ab.
Einige Aspekte werden in diesen Ausführungen nicht berücksichtigt. Hierzu gehören (4, 5) die
- Vertrauensbereiche der NNT und des Dilutionsfaktors
- notwendige Voraussetzung eines statistisch signifikanten Studienergebnisses für die NNT-Berechnung
- Normierung der NNT auf ein bestimmtes Zeitintervall bei nichtlinearer Entwicklung des Verlaufs.
Der Vertrauensbereich einer NNT errechnet sich aus dem Vertrauensbereich der absoluten Risikoreduktion (ARR). Bei nichtsignifikantem Studienergebnis schließt er eine absolute Risikoreduktion (ARR) von Null ein. Hier würde die NNT dann unendlich (6), gegebenenfalls sogar negativ werden. Unberücksichtigt bleibt auch das Problem, dass die Wirksamkeit von Therapien in verschiedenen Patientenkollektiven und bei verschiedenen Studienbedingungen oft nicht vergleichbar sind.
Für „NNT-1“ wird auch die Bezeichnung NTN („number needed to treat needlessly“) verwendet. Der Informationsgehalt von NTN ist gering. Es wird leicht übersehen, dass sich die fehlende Notwendigkeit der Behandlung nur auf einen bestimmten harten Endpunkt in einem bestimmten Zeitraum bezieht. Während dieser Zeit werden in erfolgreichen Studien bei einem Teil der scheinbar unnötigerweise Behandelten pathophysiologische Prozesse durch die Therapie günstig beeinflusst, und die Vermeidung harter Endpunkte kann jenseits des Studienzeitraums liegen. Die NTN kann übertrieben wirken, wohingegen NNT eher eine vorsichtige oder konservativ zu nennende Nutzenbeschreibung ist.
Kleinere NNT nach intensiverer Diagnostik
Auf die ökonomische Bedeutung der NNT als Grundlage für Kosten-Wirksamkeits-Analysen kann nicht näher eingegangen werden. Bei Präventionsstrategien stellt sich die Frage, ob immer neue und meist teurere Medikamente dazu führen, die kleinstmögliche NNT zu erreichen. Möglicherweise laufen wir wie der Esel der Karotte hinterher, die im festen Abstand von dessen Nase aufgehängt ist. Häufig könnte eine Strategie effektiver sein, bei der angestrebt wird, die kleinstmögliche NNT zu reduzieren.
Grafik 1c veranschaulicht, dass bei gleicher Wirkstärke eines Medikaments die NNT gesenkt werden kann. Hierzu müssen die Patienten identifiziert werden, die nicht oder wenig beziehungsweise deutlich von einer Behandlung profitieren. Das bedeutet, dass die NNT durch eine verbesserte Diagnostik gesenkt werden kann. Als wegweisend können hier unter anderem die Ansätze in der Onkologie und Infektiologie gelten (7). Die Abklärung muss nicht in jedem Fall vor der Therapie, sie kann auch therapiebegleitend erfolgen.
Fast alle Empfehlungen zur Behandlung der Hauptrisikofaktoren Hypertonie und Hyperlipidämie enthalten Ratschläge zur kardiovaskulären Risikostratifizierung. Hiermit sollen Patienten von einer Dauermedikation ausgeschlossen werden, bei denen lediglich die Normgrenze eines Risikofaktors – möglicherweise nur passager – überschritten wird, bei denen unter Berücksichtigung weiterer Faktoren aber kein wesentlich erhöhtes kardiovaskuläres Risiko besteht. Diese Empfehlungen werden nur unvollständig und ineffizient befolgt, um die NNT zu senken. Unter anderem sind die Ratschläge zur Stratifizierung nicht einheitlich. Abhängig von der epidemiologischen Datenerhebung, aus der ein Risikoscore hervorgegangen ist, sind die Risikoberechnungen unterschiedlich. Außerdem neigen einige Wissenschaftler je nach Forschungsschwerpunkt dazu, den Blutdruck oder die Lipidwerte quantitativ, den anderen Parameter dagegen lediglich qualitativ in die Risikobewertung aufzunehmen. Dies beeinträchtigt jedoch die Genauigkeit der Risikoschätzung.
Diagnostik verursacht Kosten, insbesondere neuere nichtinvasive Verfahren. Eine nichtinvasive Abklärung ist aber meist vorteilhafter als eine jahrelange nutzlose medikamentöse Therapie. Für den behandelnden Arzt bestehen allerdings keine Verrechnungsmöglichkeiten zwischen erzeugten Diagnostik- und eingesparten Therapiekosten. Außerdem besteht die Gefahr, dass Ärzte, wenn sie keine Arzneimittel verordnen oder verordnete wieder absetzen, von einigen Patienten für inkompetent und bei begrenztem Arzneimittelbudget für ausschließlich am Gewinn orientiert gehalten werden (Kasten 2).
Die evidenzbasierte Medizin lässt den Schluss zu, dass durch eine gründlichere Diagnostik und durch Therapiemodifikationen die NNT reduziert werden kann. So lange die hierzu möglichen und notwendigen Studien nicht vorliegen, genügt einfacher Menschenverstand, wie so häufig in der Medizin.
Der Autor dankt Prof. Dr. rer. nat. Gerhard Osius, Institut für Statistik der Universität Bremen, für Anregungen und die Durchsicht des Manuskripts.
Interessenkonflikt
Der Autor erklärt, dass kein Interessenkonflikt im Sinne der Richtlinien des International Committee of Medical Journal Editors besteht.
Manuskriptdaten
eingereicht: 6. 3. 2006, revidierte Fassung angenommen: 25. 8. 2006
Anschrift des Verfassers
Prof. Dr. med. Manfred Anlauf
Friedrich-Plettke-Weg 12, 27570 Bremerhaven
E-Mail: manfred.anlauf@t-online.de
1.
Gigerenzer G: Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken. Berlin: Berlin-Verlag 2002; 53.
2.
Malenka DJ, Baron JA, Johansen S, Wahrenberger JW, Ross JM: The framing effect of relative and absolute risk. J Gen Intern Med 1993: 543–8. MEDLINE
3.
Kolenda KD.: Sekundärprävention der koronaren Herzkrankheit – Effizienz nachweisbar. Wirksamkeit von Lebensstilveränderungen im Vergleich zur medikamentösen Therapie: Schlusswort. Dtsch Arztebl 2006; 103(10): A 347. MEDLINE
4.
Windeler J.: Zur Aussagekraft der Number needed to treat (Leserbrief). Arzneimittelbrief 2004; 38: 23.
5.
Riffenburgh RH: Statistics in medicine. Amsterdam, Tokyo: Elsevier Inc. 2006; 437–41.
6.
Altman DG: Confidence intervals for the number needed to treat. BMJ 1998; 317: 1309–12. MEDLINE
7.
Der Internist: Individualisierte Therapie – ein Paradigmenwechsel. 2006; 47 (Suppl 1): S 5–S40
8.
Psaty BM, Lumley T, Furberg CD et al.: Health outcomes associated with various antihypertensive therapies used as first-line agents: a network meta-analysis. JAMA 2003; 289: 2534–44. MEDLINE
Kasten 1
Kasten 2
Grafik 1
Grafik 2
1. | Gigerenzer G: Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken. Berlin: Berlin-Verlag 2002; 53. |
2. | Malenka DJ, Baron JA, Johansen S, Wahrenberger JW, Ross JM: The framing effect of relative and absolute risk. J Gen Intern Med 1993: 543–8. MEDLINE |
3. | Kolenda KD.: Sekundärprävention der koronaren Herzkrankheit – Effizienz nachweisbar. Wirksamkeit von Lebensstilveränderungen im Vergleich zur medikamentösen Therapie: Schlusswort. Dtsch Arztebl 2006; 103(10): A 347. MEDLINE |
4. | Windeler J.: Zur Aussagekraft der Number needed to treat (Leserbrief). Arzneimittelbrief 2004; 38: 23. |
5. | Riffenburgh RH: Statistics in medicine. Amsterdam, Tokyo: Elsevier Inc. 2006; 437–41. |
6. | Altman DG: Confidence intervals for the number needed to treat. BMJ 1998; 317: 1309–12. MEDLINE |
7. | Der Internist: Individualisierte Therapie – ein Paradigmenwechsel. 2006; 47 (Suppl 1): S 5–S40 |
8. | Psaty BM, Lumley T, Furberg CD et al.: Health outcomes associated with various antihypertensive therapies used as first-line agents: a network meta-analysis. JAMA 2003; 289: 2534–44. MEDLINE |
Kommentare
Die Kommentarfunktion steht zur Zeit nicht zur Verfügung.