ArchivDeutsches Ärzteblatt24/2009Anforderungen und Bewertung der Ergebnisse von Laboruntersuchungen

MEDIZIN: Übersichtsarbeit

Anforderungen und Bewertung der Ergebnisse von Laboruntersuchungen

Teil 5 der Serie zur Bewertung wissenschaftlicher Publikationen

Requirements and Assessment of Laboratory Tests—Part 5 of a Series on Evaluation of Scientific Publications

Bautsch, Wilfried

Der folgende Artikel bezieht sich nicht unmittelbar auf die Bewertung medizinischer Publikationen. Er erscheint aber dennoch im Rahmen dieser Serie, weil er ein verwandtes Problem zum Inhalt hat: die statistische Bewertung einer klinischen Entscheidungssituation. Das im vorliegenden Text behandelte Thema des positiven prädiktiven Wertes taucht immer wieder in wissenschaftlichen Publikationen auf.
Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...
Hintergrund: Die hohen Sensitivitäten und Spezifitäten vorhandener Labortests verführen zusammen mit einem vergleichsweise niedrigen Preis der Einzeltestung zu einem breiten, weitgehend unkritischen Anforderungsverhalten.
Methoden: Erläuterung des Bayesschen Theorems und seine Anwendung auf laboratoriumsmedizinische Anforderungen in weitgehend nicht mathematischer Form unter Zuhilfenahme selektiver Literatur.
Ergebnisse und Schlussfolgerungen: Nach dem Bayesschen Theorem ist der positiv prädiktive Wert eines laboratoriumsmedizinischen Testergebnisses direkt von der Prävalenz der Erkrankung im Untersuchungskollektiv abhängig. Der klinische Aussagewert von laboratoriumsmedizinischen Testergebnissen ist daher von einer klaren Indikationsstellung abhängig. Ergebnisse von nicht indizierten Anforderungen sind ohne fundierte Datenbasis zur Prävalenz der Erkrankung klinisch unbrauchbar und sollten daher nicht angefordert werden. Das gilt unabhängig von ethischen oder ökonomischen Überlegungen.
Dtsch Arztebl Int 2009; 106(24): 403–6
DOI: 10.3238/arztebl.2009.0403
Schlüsselwörter: Labordiagnostik, Blutanalyse, Diagnosestellung, PSA-Test, Borreliose
LNSLNS Das Anforderungsverhalten von Laboruntersuchungen ist in der Praxis häufig recht unkritisch. Ihre Kosten sind vergleichsweise niedrig – in Bezug zu etwa den bildgebenden Untersuchungsverfahren – bei gleichzeitig hoher Sensitivität und Spezifität der einzelnen Analysenergebnisse. Dadurch wird suggeriert, dass durch Anforderung vieler Laborparameter schnell, mit geringem Aufwand und vergleichsweise kostengünstig klinisch verwertbare Aussagen zu Erkrankungen erhalten werden können. Dies wird auch dann angenommen, wenn die getesteten Parameter mit dem vorliegenden Beschwerdebild des Patienten wenig oder nichts zu tun haben. Neben dem Anfordern von teilweise sehr umfangreichen Routineprofilen betrifft dies auch das Screening auf solche Erkrankungen, die vor Auftreten klinischer Symptome diagnostiziert werden sollten, etwa Tumorerkrankungen oder bestimmte, in Stadien verlaufende Infektionskrankheiten, wie etwa die Borreliose.

Dabei wird übersehen, dass der Aussagewert von Testergebnissen von einer klaren Indikationsstellung abhängt. Dieser Aspekt wird in den öffentlich geführten Diskussionen über den Wert von Screeninguntersuchungen zwar immer wieder genannt (1), spielt aber auch in der täglichen ärztlichen Praxis eine wichtige Rolle. Empfohlene Screeninguntersuchungen, etwa im Rahmen des Neugeborenen-Screenings, sind natürlich nicht gemeint, da die hier genannten Überlegungen bei solchen Empfehlungen explizit berücksichtigt wurden.

Diese Arbeit skizziert die zugrunde liegende mathematische Beziehung in weitgehend nicht mathematischer Form und erläutert die Konsequenzen für das diagnostische Anforderungsverhalten in der täglichen ärztlichen Praxis. Dieses Problem hat mit Statistik zu tun und gerade auf diesem Gebiet sind intuitive Vorstellungen häufig irreführend. Das grundlegende Problem wird in nachfolgender Multiple-Choice-Frage verdeutlicht.

A laboratory test (for example, for borreliosis) has a diagnostic specificity of 98%. How probable is it that a patient who gives a positive test result does in fact have this disease?
a) You have to know the sensitivity too to be able to answer this question.
b) 98%
c) (1-specificity) × 100 (%) = 2%
d) None of these answers is correct.

Leser, die diese Frage richtig beantworten konnten, brauchen eigentlich nicht weiter zu lesen (die Lösung findet sich am Schluss des Artikels). Dieser Artikel kann für die praktische ärztliche Tätigkeit sehr hilfreich sein, denn das zugrunde liegende Problem taucht in vielen Variationen immer wieder auf.

Die meisten Menschen, denen dieses Problem gestellt wird, versuchen es, allein mithilfe der Spezifität zu lösen: Die Spezifität gibt an, bei wie vielen gesunden Probanden auch korrekterweise ein negatives Testergebnis erhalten wurde, umgekehrt gibt 1 – Spezifität an, bei wie vielen gesunden Probanden fälschlicherweise ein positives Testergebnis erhalten wurde (Falsch-positiv-Rate). Intuitiv ist man geneigt anzunehmen, dass jetzt alle erforderlichen Informationen vorliegen: Die Wahrscheinlichkeit sollte 98 % betragen – das ist aber falsch. Für die korrekte Lösung dieses Problems sind zusätzlich zwei weitere Angaben erforderlich, nämlich die Sensitivität des Tests und die Prävalenz der Erkrankung im Untersuchungskollektiv. Letztere ist der Anteil an erkrankten Patienten bezogen auf alle Personen, bei denen der Arzt eine entsprechende Untersuchung veranlasst. Der Grund hierfür wird in Kasten 1 (gif ppt) erläutert.

Weitere Parameter einbeziehen
Welche Konsequenzen hat das nun auf das eingangs beispielhaft angesprochene Problem einer Borreliose-Testung? Die Prävalenz einer aktiven Borreliose in der Bevölkerung ist nicht ausreichend bekannt. Schätzungen gehen von 10 bis 237 Fällen je 100 000 Einwohner aus (2) mit großen regionalen Schwankungen (3). Das Robert Koch-Institut hat 2003 für Deutschland einen Wert von 25/100 000 publiziert (4), der auch im Folgenden verwendet werden soll, um die Rechnungen etwas zu vereinfachen. Für die modernen serologischen Enzym-Immuntests auf Borreliose zusammen mit dem empfohlenen Immunoblot werden Spezifitäten von über 98 % angenommen (5), die aber nicht genau bekannt sind und je nach Testsystem etwas verschieden sein dürften. Hier wird eine Spezifität von 98 % angenommen. Dann gilt, dass man bei 100 000 Untersuchungen in der Bevölkerung 25 tatsächlich positive Ergebnisse erhält. Es soll vernachlässigt werden, dass die Sensitivität der Tests < 100 % ist. Allerdings gibt es zwei weitere grundlegende Probleme im Zusammenhang mit der Interpretation von serologischen Testergebnissen bei Borreliose, die selbst dann existieren, wenn alle Untersuchungen streng indiziert angefordert werden.

- Ein negatives Testergebnis schließt eine aktive Borreliose – gerade in den Frühstadien – nicht sicher aus, weil die Tests keine 100-prozentige Sensitivität haben
- Die verfügbaren serologischen Tests können nicht sicher zwischen einer aktiven Borreliose und einem Titer nach abgeheilter Borreliose unterscheiden, sodass auch eindeutig positive serologische Befunde per se noch keine Behandlungsindikation darstellen.

Neben den 25 tatsächlich positiven Ergebnissen wird es auch 2 000 falsch positive Testergebnisse geben, weil 1 – Spezifität = 2 % beträgt. Man wird insgesamt also 2 025 positive Testergebnisse erhalten, von denen 25 durch eine aktive Borreliose verursacht sind. Das entspricht einer Wahrscheinlichkeit von etwa 1,25 %, dass ein Proband mit einem positiven Testergebnis auch tatsächlich an einer aktiven Borreliose leidet. Dieser Test eignet sich sicherlich nicht für ein Bevölkerungsscreening, weil ein positives Testergebnis mit fast 99-prozentiger Sicherheit falsch ist.

Der Arzt kann die Prävalenz einer Erkrankung beeinflussen. Gemeint ist nämlich immer die Prävalenz der Erkrankung im Untersuchungskollektiv, also bei den Patienten, bei denen er eine Untersuchung veranlasst. Wenn also eine Borreliose-Testung bei jedem Patienten angefordert wird – vollkommen unabhängig von den zugrunde liegenden Beschwerden – nähert sich der Aussagewert des Einzelergebnisses dem eines Bevölkerungsscreenings. Schließlich geht irgendwann jeder einmal zum Arzt. Und der Aussagewert eines positiven Testergebnisses geht dann gegen null.

Anders ist die Situation, wenn die Testung auch indiziert angefordert wird, zum Beispiel weil sich ein Patient mit einer akut aufgetretenen peripheren Fazialisparese vorstellt. Die Prävalenz der Borreliose bei Patienten mit akuter Fazialisparese ist nicht sehr gut untersucht, eine neuere norwegische Arbeit gibt etwa 10 % an (6), bei Kindern liegt dieser Wert sicherlich deutlich höher. In diesem Patientenkollektiv resultieren ganz andere Ergebnisse: Bei 1 000 Untersuchungen werden 18 falsch positiv sein (1 – Spezifität = 2 % von 900 negativen Patienten), aber es gibt 100 tatsächlich positive Befunde. Die Wahrscheinlichkeit, dass ein Patient mit einem positiven Testergebnis auch tatsächlich eine Borreliose hat, beträgt also (100/100+18) × 100 ~ 85 %, bei Kindern wird das Ergebnis entsprechend höher sein.

Zusammenfassung
Sensitivität und Spezifität sind testspezifische Eigenschaften, die der Arzt nicht aktiv beeinflussen kann. Dies gilt unter der Voraussetzung korrekter Testdurchführung und -befundung, einschließlich Prä- und Postanalytik. Dagegen ist der Aussagewert eines positiven Testergebnisses, der positiv prädiktive Wert, kritisch von der Prävalenz der Erkrankung im Testkollektiv abhängig – und die kann der Arzt beeinflussen. Tests sollten grundsätzlich nur indiziert angefordert werden, denn nur dann ist ein Testergebnis auch klinisch verwertbar. Ergebnisse von nicht indizierten Anforderungen sind ohne fundierte Datenbasis zur Prävalenz der Erkrankung klinisch unbrauchbar und sollten daher nicht erbeten werden. Dies gilt unabhängig von ökonomischen und ethischen Argumenten.

Was hier am Beispiel des Borreliosetests gezeigt wurde, gilt für alle anderen Labortests. Die Überlegungen sind auch unabhängig davon, ob es sich um einen Labortest oder anderen Untersuchungen handelt, etwa endoskopische, röntgenologische, sonografische, elektrokardiografische oder klinische Verfahren: Nicht indizierte Untersuchungen führen zu einer Senkung des positiv prädiktiven Werts und somit zur Zunahme falsch positiver Testergebnisse.

Die richtige Antwort auf die eingangs gestellte Multiple-choice-Frage lautet: d.

Interessenkonflikt
Der Autor erklärt, dass kein Interessenkonflikt im Sinne der Richtlinien des International Committee of Medical Journal Editors besteht.

Manuskriptdaten
eingereicht: 6. 2. 2007, revidierte Fassung angenommen: 19. 10. 2007

Anschrift des Verfassers
Prof. Dr. med. habil. Dr. rer. nat. Wilfried Bautsch
Institut für Mikrobiologie, Immunologie und Krankenhaushygiene
Städtisches Klinikum Braunschweig gGmbH
Celler Straße 38, 38814 Braunschweig
E-Mail: w.bautsch@klinikum-braunschweig.de

Summary
Requirements and Assessment of Laboratory Tests—Part 5 of a Series on Evaluation of Scientific Publications
Background: Current laboratory tests exhibit high sensitivity and specificity combined with comparatively low costs thus favoring broad and uncritical ordering habits.
Methods: Introduction of Bayes’ theorem and discussion of its implications for laboratory test results in a mostly non-technical form, accompanied by a selective literature review.
Results and conclusions: According to Bayes’ theorem the positive
predictive value of laboratory test results is directly dependent on the prevalence of the disease in a given patient cohort. Thus, the clinical value of a given test result is critically dependent on a precise indication. Ordering of tests that are not indicated in a given patient is clinically useless and undesirable, where detailed information on disease prevalence is missing. These considerations are valid irrespective of ethical or economic considerations.
Dtsch Arztebl Int 2009; 106(24): 403–6
DOI: 10.3238/arztebl.2009.0403
Key words: laboratory diagnostics, blood analysis, diagnosis, PSA test, borreliosis

The English version of this article is available online:
www.aerzteblatt-international.de
1.
Bögermann C, Rübben H: Früherkennung des Prostatakarzinoms. Dtsch Arztebl 2007; 104(8): A 503–4. VOLLTEXT
2.
O´Connell S, Granström M, Gray JS, Stanek G: Epidemiology of European Lyme borreliosis. Zentralbl Bakteriol 1998; 287: 229–40. MEDLINE
3.
Talaska T: Borreliose-Epidemiologie. Brandenburgisches Ärzteblatt 2002; 11: 338–40. www.laekb.de/15/15Beitraege/95021TH0211.pdf
4.
Mehnert WH, Krause G: Surveillance of lyme borreliosis in Germany, 2002 and 2003. Euro Surveill 2005; 10: 83–5. MEDLINE
5.
Goettner G, Schulte-Spechtel U, Hillermann R, Liegl G, Wilske B, Fingerle V: Improvement of Lyme borreliosis serodiagnosis by a newly developed recombinant immunoglobulin G (IgG) and IgM line immunoblot assay and addition of VlsE and DbpA homologues. J Microbiol 2005; 43: 3602–9. MEDLINE
6.
Ljostad U, Okstad S, Topstadt T, Mygland A, Monstad P: Acute peripheral facial palsy in adults. J Neurol 2005; 252: 672–6. MEDLINE
Institut für Mikrobiologie, Immunologie und Krankenhaushygiene, Städtisches Klinikum Braunschweig gGmbH: Prof. Dr. med. habil. Dr. rer. nat. Bautsch
1. Bögermann C, Rübben H: Früherkennung des Prostatakarzinoms. Dtsch Arztebl 2007; 104(8): A 503–4. VOLLTEXT
2. O´Connell S, Granström M, Gray JS, Stanek G: Epidemiology of European Lyme borreliosis. Zentralbl Bakteriol 1998; 287: 229–40. MEDLINE
3. Talaska T: Borreliose-Epidemiologie. Brandenburgisches Ärzteblatt 2002; 11: 338–40. www.laekb.de/15/15Beitraege/95021TH0211.pdf
4. Mehnert WH, Krause G: Surveillance of lyme borreliosis in Germany, 2002 and 2003. Euro Surveill 2005; 10: 83–5. MEDLINE
5. Goettner G, Schulte-Spechtel U, Hillermann R, Liegl G, Wilske B, Fingerle V: Improvement of Lyme borreliosis serodiagnosis by a newly developed recombinant immunoglobulin G (IgG) and IgM line immunoblot assay and addition of VlsE and DbpA homologues. J Microbiol 2005; 43: 3602–9. MEDLINE
6. Ljostad U, Okstad S, Topstadt T, Mygland A, Monstad P: Acute peripheral facial palsy in adults. J Neurol 2005; 252: 672–6. MEDLINE

Kommentare

Die Kommentarfunktion steht zur Zeit nicht zur Verfügung.

Der klinische Schnappschuss

Alle Leserbriefe zum Thema

Stellenangebote