ArchivDeutsches Ärzteblatt26/2019Studienplanung und -auswertung nach dem Stepped-Wedge-Design

MEDIZIN: Übersichtsarbeit

Studienplanung und -auswertung nach dem Stepped-Wedge-Design

Teil 26 der Serie zur Bewertung wissenschaftlicher Publikationen

Planning and analysis of trials using a stepped wedge design

Dtsch Arztebl Int 2019; 116: 453-8; DOI: 10.3238/arztebl.2019.0453

Wellek, Stefan; Donner-Banzhoff, Norbert; König, Jochem; Mildenberger, Philipp; Blettner, Maria

Als E-Mail versenden...
Auf facebook teilen...
Twittern...
Drucken...

Hintergrund: Das Stepped-Wedge-Design (SWD) ist in den letzten Jahren ausgesprochen populär geworden, insbesondere in der Versorgungsforschung. Die randomisierte Zuweisung zu den Behandlungsoptionen erfolgt typischerweise in Gruppen (Clustern).

Methoden: Es erfolgte eine selektive Literaturrecherche in PubMed sowie der statistischen Literaturdatenbank CIS. Die Grundprinzipien und die statistischen Verfahren werden vorgestellt.

Ergebnisse: Im Standardfall einer SWD-Studie wird mit der Intervention zu einem von Cluster zu Cluster variierenden Zeitpunkt begonnen. Bis zu diesem Zeitpunkt befinden sich alle Probanden der jeweiligen Gruppe im Kontrollarm. Nach Eintritt in die Interventionsgruppe wird die Intervention bis zum Ende der Laufzeit des Studienprojekts unverändert weitergeführt. Der Startzeitpunkt für die Intervention wird für jedes Cluster mittels Randomisierung festgelegt. Zum ersten Messzeitpunkt erfolgt in keinem Cluster eine Intervention, zum letzten wird die Intervention in allen Clustern durchgeführt. Der Therapieeffekt kann – unter Berücksichtigung einer zwischen allen Zeitpunkten als identisch angenommenen Korrelation – optimal geschätzt werden. Für den zugehörigen Signifikanztest existiert ein Verfahren für die Berechnung der Power beziehungsweise der benötigten Anzahl von Clustern. Alle dargestellten statistischen Verfahren basieren auf der Voraussetzung, dass die Clustermittelwerte normalverteilt sind und dass der Effekt der Intervention über alle Messzeitpunkte hinweg konstant bleibt.

Schlussfolgerungen: Für die Planung und Auswertung von SWD-Studien stehen die erforderlichen statistischen Werkzeuge zur Verfügung. Dennoch ist ein entsprechendes Studienprojekt mit erheblichen Risiken behaftet, da valide Ergebnisse nur zu erhalten sind, wenn weitreichende Modellannahmen erfüllt sind.

LNSLNS

Die Bedeutung des Prinzips der Randomisierung zum Vergleich von Therapien und Interventionen ist in der medizinischen Forschung weiterhin unumstritten und randomisierte kontrollierte Studien (RCT) sind als Goldstandard anerkannt. Aus praktischen Erwägungen wurden neben dem klassischen Design unterschiedliche Varianten entwickelt, darunter die sogenannte clusterrandomisierte Studie und das Stepped-Wedge-Design (SWD). Beim clusterrandomisierten Parallelgruppendesign – dem vorherrschenden Design für clusterrandomisierte Studien – wird die zufällige Zuteilung der Intervention nicht mehr für einzelne Individuen, sondern für eine Gruppe von Individuen (etwa in Arztpraxen, Schulklassen, Regionen) vorgenommen. Diese Gruppen werden im Allgemeinen und auch im Folgenden als Cluster bezeichnet.

Grundprinzip, Modellvoraussetzungen und Schätzung des Behandlungseffekts

Beim SWD werden alle Individuen oder Cluster zunächst eine Zeit lang unter Kontrollbedingungen und dann bis zum Ende der Studie unter Interventionsbedingungen beobachtet. Der Zeitpunkt des Übergangs zur Intervention wird randomisiert zugeordnet. Die Anzahl von konsekutiven Zeitpunkten, zu denen die Outcome-Variable beobachtet wird, ist – von Fällen mit fehlenden Werten abgesehen – für alle Cluster identisch. Individuen können entweder jeweils nur einmal behandelt werden (SWD vom Querschnittstyp) oder im Zeitverlauf von der Kontrollbehandlung zur Intervention wechseln (SWD vom offenen versus geschlossenen Kohortentyp). Grundsätzlich kann beim SWD die Beobachtungseinheit entweder ein Individuum oder ein Cluster sein. In der Praxis wird das SWD aber (meistens) als Alternative zur clusterrandomisierten Studie durchgeführt.

Das SWD hat für die Planung wissenschaftlicher Studien in der Medizin und in der Versorgungsforschung in den letzten Jahren eine beachtliche Popularität erlangt. Dies spiegelt sich auch im Volumen medizinisch-wissenschaftlicher Literatur zum SWD wider: So ergab die Suche in der Datenbank PubMed unter dem Stichwort „Stepped Wedge“ bei einer systematischen Literaturübersicht zu Publikationen der Jahre 2010–2014 insgesamt 491 Treffer (1) (Stand: 8. Juni 2018). Auch unter den Projekten der Versorgungsforschung, die vom Innovationsfonds des Gemeinsamen Bundes­aus­schusses (G-BA) seit 2015 geförderte werden, sind mehrere Studien, in denen die Intervention durch ein SWD evaluiert werden soll.

Das SWD wurde bereits Ende der 1970-er Jahre in der Literatur zur Versuchsplanung beschrieben (2). Das erste große Studienprojekt, in dem nach diesem Prinzip vorgegangen und der Begriff eingeführt wurde, geht auf das Jahr 1987 zurück (3). In dieser Studie wurde ein groß angelegtes Impfprogramm in Gambia durchgeführt. Für diese Impfaktion wurden 17 Teams gebildet. Alle Teams starteten zunächst mit einem Standardimpfprogramm. Nach und nach wurde jeweils in einem weiteren Team die Hepatitis-Impfung hinzugefügt. Ziel war es, nach etwa vier Jahren alle Kinder gegen Hepatitis-B-Viren (HBV) zu impfen. Als Hauptgrund für dieses Vorgehen wurden logistische Aspekte angeführt, unter anderem die Verfügbarkeit des Impfstoffes. Zielgröße war die Inzidenz von Lebertumoren. Die indirekte Evidenz der Wirkung der Impfung zur Reduktion der HBV-Infektion war zuvor bereits durch mehrere Studien in Hochrisiko-Gruppen bestätigt worden. Bekannt war auch, dass die HBV-Infektion ein Risikofaktor für Leberkrebs ist. Wünschenswert war – so die Autoren der Studie – eine direkte Evidenz dafür zu erhalten, dass die Impfung die Inzidenz an Lebertumoren reduziert. Es wurde damals auch darüber diskutiert, ob man alternativ zum SWD ein klassisches Paralleldesign über vier Jahre durchführen sollte. Allerdings sprachen viele organisatorische Gründe dagegen, so dass man sich dafür entschied, stufenweise vorzugehen.

SWD-Studien werden vielfach auch als uni-direktionale Cross-over-Studien bezeichnet (4). Diese Bezeichnung begründet sich durch das in Tabelle 1 für den Standardfall einer zweiarmigen SWD-Studie dargestellte Schema für den zeitlichen Ablauf der Überführung der Cluster vom Kontroll- in den Interventions-Arm der Studie: Jedes Cluster beginnt im Kontrollarm (K). Der Übergang zur Interventionsbehandlung (I) erfolgt spätestens bis zum letzten Nachbeobachtungstermin. Für zwei aufeinanderfolgende Zeitpunkte sind also nur die Kombinationen K-K, K-I, I-I, nicht aber I-K, möglich. Anders als im echten, bi-direktionalen Cross-over (5) ist also nicht vorgesehen, dass es auch Beobachtungseinheiten gibt, für die in der Studie die Messungen unter Kontrollbedingungen nach Beendigung der Interventionsphase erfolgen. Welches Cluster welcher Zeile der Versuchsplan-Matrix zugeordnet wird, wird per Randomisierung festgelegt. In Tabelle 1 ist eine solche Versuchsplan-Matrix mit der namensgebenden gestuften Keil(Stepped Wedge)-Form zwischen Kontroll- und Interventionsperioden zu sehen. Die Anzahl von Clustern pro Startzeitpunkt braucht dabei nicht auf 1 beschränkt zu sein, sollte aber über die Zeitpunkte hinweg nach Möglichkeit konstant bleiben.

Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Tabelle 1
Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Spezifikation der verglichenen Designs
Spezifikation der verglichenen Designs
eTabelle
Spezifikation der verglichenen Designs

SWDs werden dann gegenüber dem Paralleldesign oder dem (echten) Cross-over-Design bevorzugt, wenn man davon ausgeht, dass die Intervention als sinnvoll und gewinnbringend erachtet wird und wenn man es nicht rechtfertigen kann (oder will), eine einmal eingeführte Intervention abzubrechen. Das SWD hat darüber hinaus den Vorteil, dass jeweils nur in wenigen Clustern gleichzeitig die Intervention etabliert werden muss, was unter organisatorischen Gesichtspunkten oft sehr bedeutsam ist. So war es etwa in dem genannten Beispiel der Gambia-Studie organisatorisch nicht möglich, bei allen 60 000 Kindern (50 % des Studienkollektivs) zum selben Zeitpunkt mit der HBV-Impfung zu beginnen.

Für das Design aus Tabelle 1 wird in Tabelle 2 exemplarisch das optimale Gewichtungsschema dargestellt. Dabei wird hier von folgenden vereinfachenden Annahmen ausgegangen (4, 6):

  • Annahme 1: Die Analyse erfolgt in zwei Schritten: Für jedes Cluster und jeden Messzeitpunkt werden Mittelwerte für das Zielkriterium bestimmt. Sie bilden die Grundlage für den zweiten, hier ausschließlich beschriebenen Schritt – Modellannahmen werden über die Verteilung der Mittelwerte und deren Korrelationsstruktur getroffen.
  • Annahme 2: Die Clustermittelwerte sind normalverteilt (zumindest näherungsweise) mit einer Varianz, die weder vom Zeitpunkt noch von der Behandlung abhängt.
  • Annahme 3: Die Clustermittelwerte sind zwischen den Messzeitpunkten korreliert. Das Ausmaß dieser Korrelation hängt aber weder vom Abstand der Messzeitpunkte noch von der Art der Behandlung (K/I) ab. Die Korrelation ist auch davon abhängig, ob und wie Individuen wiederholt in die Analysen eingehen.
  • Annahme 4: Gemittelt über die Population aller Cluster setzen sich die clusterweisen arithmetischen Mittelwerte additiv zusammen aus einem für den Messzeitpunkt spezifischen Periodeneffekt und dem zeitunabhängigen Effekt (im Folgenden als θ bezeichnet) der zu prüfenden Therapie (Intervention).
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5
Tabelle 2
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5

Unter den genannten Annahmen lässt sich auch der Standardfehler (stderr) des optimalen Schätzers des Therapieeffekts exakt berechnen. Um diesen für eine beliebige Anzahl von Interventionsstartzeitpunkten (T) und Clustern (n), die zum selben Zeitpunkt in die Interventionsphase überführt werden, zu ermitteln, kann eine relativ einfache Formel genutzt werden (Kasten 1). Die Formel lässt sich dazu verwenden, für den als Ergebnis der Auswertung einer SWD-Studie erhaltenen geschätzten Therapieeffekt ein Konfidenzintervall zu berechnen. Die in Kasten 1 tabellierten Werte zeigen, wie die Weite dieses Konfidenzintervalls und damit die statistische Präzision der Schätzung durch die Grundparameter des Designs beeinflusst wird.

Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt
Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt
Kasten 1
Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt

Signifikanztest, Power und Fallzahlplanung

Genauso einfach wie die Berechnung von Konfidenzgrenzen ist die Durchführung eines statistischen Tests der Nullhypothese, die besagt, dass der Therapieeffekt θ „in Wahrheit“ (das heißt, ohne Überlagerung durch zufallsbedingte Abweichungen) gleich 0 ist.

Bei der Planung eines SWD ist zu beachten, dass sich die Berechnungsvorschrift für die Power nicht in eine einfache Formel für die Fallzahl n (= Anzahl von Clustern mit Interventionsbeginn zum selben Zeitpunkt) umwandeln lässt. Wie aus der in Kasten 1 gezeigten Formel ersichtlich wird, hängt der Standardfehler von θest, und damit auch die Power, nicht nur von der Varianz (σ²) der Clustermittelwerte, der Clusterzahl (n), sondern auch von der Anzahl der Interventions-Startzeitpunkte (T) und der Korrelation zwischen wiederholten Messungen im selben Cluster ab. Entsprechend unterschiedlich sind daher die Schlussfolgerungen, die sich aus vergleichenden Betrachtungen zur Effizienz verschiedener SWD, clusterrandomisierter Studien im Parallelgruppendesign und individuell randomisierter Studien ergeben. Man kann die Anzahl der teilnehmenden Individuen, die Anzahl der wiederholten Messungen pro Individuum, die Anzahl der Cluster je Startzeitpunkt und die Anzahl der Startzeitpunkte variieren.

Im eKasten werden clusterrandomisierte Studien im SWD und im Parallelgruppendesign in verschiedenen Szenarien verglichen, in denen sowohl die Varianz σ² der Clustermittelwerte als auch deren Korrelation ρ zwischen den Messzeitpunkten vom sogenannten Intraclass-Korrelationskoeffizienten (ICC) innerhalb der Cluster abhängen. Misst man die Effizienz eines Designs an der Gesamtzahl von Clustern, die benötigt werden, um in einem Test auf dem üblichen Signifikanzniveau von α = 0,05 (zweiseitig) einen Effekt von θ = 0,25 mit einer Wahrscheinlichkeit von 0,90 (Power) aufzudecken, zeigt sich: SWDs besitzen in diesen Situationen, außer für sehr geringe Werte des ICC, eine höhere Effizienz als das Parallelgruppen-Design (eGrafik ). Zu beachten ist jedoch, dass sich dieses Bild qualitativ grundsätzlich ändert, wenn die Anzahl der zu jedem Zeitpunkt in den einzelnen Clustern durchzuführenden Messungen – anders als in den im eKasten untersuchten Szenarien – für alle Designs identisch ist. Das Parallelgruppen-Design besitzt dann – außer für sehr hohe Werte von ρ – wesentlich höhere Effizienz als ein SWD.

Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
eGrafik
Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)
eKasten
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)

Vorgehen bei unbekannter Streuung der Outcome-Variablen und unbekannter zeitlicher Korrelation

Die hier zusammengestellten Fakten und Ergebnisse zur statistischen Planung und Analyse von SWD-Studien gelten unter der Annahme, dass sowohl die Varianz σ2 zwischen den Clustern als auch der Korrelationskoeffizient ρ zwischen den Messergebnissen für dasselbe Cluster zu verschiedenen Zeitpunkten bekannte Größen sind. Wann immer eine SWD-Studie ohne entsprechende Vorkenntnisse auszuwerten ist, muss ein wesentlich komplizierteres statistisches Verfahren eingesetzt werden, das es erlaubt, außer dem primär interessierenden Behandlungseffekt θ auch σ2 und ρ aus den aktuellen Studiendaten zu schätzen.

Für eine detaillierte Beschreibung dieser erweiterten Schätzprozedur, mittels derer die in Kasten 2 gezeigten Ergebnisse der Auswertung der Beispiel-SWD-Studie aus Tabelle 3 gewonnen wurden, sei auf die Dokumentation von Software-Programmen für die Analyse sogenannter gemischter linearer Modelle, wie zum Beispiel die Prozedur PROC MIXED aus dem SAS-System (9), verwiesen. Solche komplexeren statistischen Modelle sind auch für die Analyse von Studien heranzuziehen, in denen davon auszugehen ist, dass die Korrelationen zwischen zeitlich wiederholten Messungen durch intraindividuelle Effekte zustande kommen. Das hat typischerweise unter anderem zur Folge, dass die Variabilität zwischen den Clustern nicht mehr entsprechend der Annahme 2 durch einen einzigen Streuungsparameter beschrieben werden kann. Auch wenn die Schätzung von σ2 und ρ im Rahmen der Auswertung einer SWD-Studie zu erfolgen hat, wird bei der Planung der Studie üblicher weise (4) nach dem oben dargestellten Ansatz für den Fall bekannter Werte für σ2 und ρ verfahren.

Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Kasten 2
Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Rohdaten zum Beispiel aus Kasten 2
Rohdaten zum Beispiel aus Kasten 2
Tabelle 3
Rohdaten zum Beispiel aus Kasten 2

Diskussion

Genau wie beim echten Cross-over-Design erhält man in einer SWD-Studie Daten von longitudinaler Struktur, da in jeder Beobachtungseinheit (Cluster) wiederholte Messungen durchgeführt werden. Beide Designs haben ferner gemeinsam, dass entsprechende Studien mit hohen Risiken behaftet sind: Wenn die – sehr restriktive – Grundannahme, dass es keine Interaktionen zwischen Interventionseffekt und Messzeitpunkt gibt, nicht erfüllt ist, lässt sich der Therapieeffekt nicht mehr biasfrei schätzen. Auf diese Voraussetzung ist sowohl bei der Planung als auch bei der Interpretation der Studien besonders zu achten.

Alternativ lässt sich eine SWD-Studie auch auffassen als eine Sequenz von T+1 Parallelgruppen-Studien mit konstanter Fallzahl (n), aber zeitlich variabler Proportion (ansteigend von 0 auf 100 %) von Beobachtungseinheiten, die dem Interventionsarm zugewiesen werden.

Auch wenn in einer SWD-Studie tatsächlich normalverteilte Clustermittelwerte vorliegen, kommt man beim Testen von Hypothesen über den Therapieeffekt meistens nicht ohne Näherungsverfahren aus. Dabei sind verschiedene Ansätze in Betracht zu ziehen, die unterschiedliche Ergebnisse liefern und von denen sich nicht allgemein sagen lässt, welcher Ansatz zu bevorzugen ist. Wie oft bei der Analyse von Longitudinaldaten werden SWD-Studien außerdem standardmäßig unter stark vereinfachenden Annahmen über die Korrelationsstruktur ausgewertet (Äquikorrelations-Modell).

Als praktische Hauptmotivation für die Durchführung von Studien nach dem SWD wird meistens angeführt, es sei erwünscht, allen Patienten wenigstens in der letzten Periode die zu prüfende Intervention zukommen zu lassen. Das gilt insbesondere als erstrebenswert, wenn Erkenntnisse vorliegen, die darauf schließen lassen, dass die Intervention wirksam ist. Dieses Argument war ausschlaggebend für die Gambia-Studie. Hier war man von der prinzipiellen Wirkung der Impfung überzeugt.

Das SWD ist dann eine Alternative zu den herkömmlichen Studien, wenn praktische Restriktionen zeigen, dass eine clusterrandomisierte Studie nicht durchführbar wäre. Dies würde nämlich voraussetzen, dass die mit der zu prüfenden Intervention einhergehenden Maßnahmen der Schulung des Pflegepersonals et cetera so zügig durchgeführt werden können, dass die Intervention bei allen zum gleichen Zeitpunkt gestartet werden könnte.

Bei korrekter (und komplexer) statistischer Auswertung können methodische Anforderungen dennoch erfüllt werden. Die Voraussetzungen für eine statistisch saubere Evaluierung des Therapieeffekts sind zwar theoretisch klar zu spezifizieren, aber in der Praxis schwierig zu überprüfen.

Interessenkonflikt
Die Autoren erklären, dass kein Interessenkonflikt besteht.

Manuskriptdaten
eingereicht: 12. 10. 2018, revidierte Fassung angenommen: 15. 4. 2019

Anschrift für die Verfasser
Prof. Dr. rer. nat. Maria Blettner
Institut für Medizinische Biometrie, Epidemiologie und Informatik
Johannes-Gutenberg-Universität Mainz
Obere Zahlbacher Straße 69
55131 Mainz
blettner@uni-mainz.de

Zitierweise
Wellek S, Donner-Banzhoff N, König J, Mildenberger P, Blettner M:
Planning and analysis of trials using a stepped wedge design—
part 26 of a serieson evaluation of scientific publications.
Dtsch Arztebl Int 2019; 116: 453–8. DOI: 10.3238/arztebl.2019.0453

►Die englische Version des Artikels ist online abrufbar unter:
www.aerzteblatt-international.de

Zusatzmaterial
eKasten, eGrafik, eTabelle:
www.aerzteblatt.de/19m0453 oder über QR-Code

1.
Beard E, Lewis JJ, Copas A, et al.: Stepped wedge randomised controlled trials: systematic review of studies published between 2010 and 2014. Trials 2015; 16: 353 CrossRef MEDLINE PubMed Central
2.
Cook TD, Campbell DT: Quasi-experimentation: design and analysis issues for field settings. Boston: Houghton Mifflin 1979.
3.
Gambia Hepatitis Study Group: The Gambia Hepatitis Intervention Study. Cancer Res 1987; 47: 5782–7.
4.
Hussey MA, Hughes JP: Design and analysis of stepped wedge cluster randomized trials. Contemp Clin Trials 2007; 28: 182–91 CrossRef MEDLINE
5.
Wellek S, Blettner M: On the proper use of the crossover design in clinical trials: part 18 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2012; 109: 276–81 VOLLTEXT
6.
Hemming K, Lilford R, Girling AJ: Stepped-wedge cluster randomised controlled trials: a generic framework including parallel and multiple-level designs. Stat Med 2015; 34: 181–96 CrossRef MEDLINE PubMed Central
7.
Rhoda DA, Murray DM, Andridge RR, Pennell ML, Hade EM: Studies with staggered starts: multiple baseline designs and group-randomized trials. Am J Public Health 2011; 101: 2164–9 CrossRef MEDLINE PubMed Central
8.
Hughes JP, Granston TS, Heagerty PJ: Current issues in the design and analysis of stepped wedge trials. Contemp Clin Trials 2015; 45 (Pt. A): 55–60 CrossRef MEDLINE PubMed Central
9.
SAS: SAS/STAT(R) 14.1 User‘s guide. The MIXED procedure. https://support.sas.com/documentation/cdl/en/statug/68162/HTML/default/viewer.htm#statug_mixed_details.htm (last accessed on 20 May 2019).
10.
Hoogendijk EO, van der Horst HE, van de Ven PM, et al.: Effectiveness of a geriatric care model for frail older adults in primary care: Results from a stepped wedge cluster randomized trial. Eur J Intern Med 2016; 28: 43–51 CrossRef
11.
Coleman K, Austin BT, Brach C, Wagner EH: Evidence on the Chronic Care Model in the new millennium. Health Affairs 2009; 28: 75–85 CrossRef MEDLINE PubMed Central
12.
Brook RH, Ware JEJ, Davies-Avery A , et al.: . Overview of adult health measures fielded in Rand’s health insurance study. Med Care 1979 ; 17: 1–131.
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universitätsmedizin Mainz; Abteilung Biostatistik, Zentralinstitut für Seelische Gesundheit, Universitätsmedizin Mannheim, Universität Heidelberg:
Prof. Dr. rer. nat. Stefan Wellek
Abteilung für Allgemeinmedizin, Präventive und Rehabilitative Medizin, Philipps-Universität Marburg: Prof. Dr. med. Norbert Donner-Banzhoff, MHSc
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universitätsmedizin Mainz: Dr. sc. hum. Jochem König
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universitätsmedizin Mainz: Philipp Mildenberger, MSc
Institut für Medizinische Biometrie, Epidemiologie und Informatik, Universitätsmedizin Mainz: Prof. Dr. rer. nat. Maria Blettner
Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt
Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt
Kasten 1
Fehlervarianz (stderr2) des optimalen Schätzers für den Therapieeffekt
Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Kasten 2
Beispiel für die Planung und statistische Auswertung einer SWD-Studie (nach [10])
Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Tabelle 1
Stepped-Wedge-Design mit fünf möglichen Startzeitpunkten der Intervention (T = 5) und einem Cluster pro Startzeitpunkt (n = 1)
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5
Tabelle 2
Optimale Gewichtung der Clustermittelwerte im Falle n = 1, T = 5
Rohdaten zum Beispiel aus Kasten 2
Rohdaten zum Beispiel aus Kasten 2
Tabelle 3
Rohdaten zum Beispiel aus Kasten 2
Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
eGrafik
Benötigte Anzahl von Clustern für verschiedene SWDs und ein Parallelgruppen- CRT in Abhängigkeit vom ICC
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)
eKasten
Planung und Auswertung von Studien auf der Grundlage des sogenannten Stepped-Wedge-Designs (SWD)
Spezifikation der verglichenen Designs
Spezifikation der verglichenen Designs
eTabelle
Spezifikation der verglichenen Designs
1. Beard E, Lewis JJ, Copas A, et al.: Stepped wedge randomised controlled trials: systematic review of studies published between 2010 and 2014. Trials 2015; 16: 353 CrossRef MEDLINE PubMed Central
2.Cook TD, Campbell DT: Quasi-experimentation: design and analysis issues for field settings. Boston: Houghton Mifflin 1979.
3.Gambia Hepatitis Study Group: The Gambia Hepatitis Intervention Study. Cancer Res 1987; 47: 5782–7.
4.Hussey MA, Hughes JP: Design and analysis of stepped wedge cluster randomized trials. Contemp Clin Trials 2007; 28: 182–91 CrossRef MEDLINE
5.Wellek S, Blettner M: On the proper use of the crossover design in clinical trials: part 18 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2012; 109: 276–81 VOLLTEXT
6.Hemming K, Lilford R, Girling AJ: Stepped-wedge cluster randomised controlled trials: a generic framework including parallel and multiple-level designs. Stat Med 2015; 34: 181–96 CrossRef MEDLINE PubMed Central
7.Rhoda DA, Murray DM, Andridge RR, Pennell ML, Hade EM: Studies with staggered starts: multiple baseline designs and group-randomized trials. Am J Public Health 2011; 101: 2164–9 CrossRef MEDLINE PubMed Central
8.Hughes JP, Granston TS, Heagerty PJ: Current issues in the design and analysis of stepped wedge trials. Contemp Clin Trials 2015; 45 (Pt. A): 55–60 CrossRef MEDLINE PubMed Central
9.SAS: SAS/STAT(R) 14.1 User‘s guide. The MIXED procedure. https://support.sas.com/documentation/cdl/en/statug/68162/HTML/default/viewer.htm#statug_mixed_details.htm (last accessed on 20 May 2019).
10.Hoogendijk EO, van der Horst HE, van de Ven PM, et al.: Effectiveness of a geriatric care model for frail older adults in primary care: Results from a stepped wedge cluster randomized trial. Eur J Intern Med 2016; 28: 43–51 CrossRef
11.Coleman K, Austin BT, Brach C, Wagner EH: Evidence on the Chronic Care Model in the new millennium. Health Affairs 2009; 28: 75–85 CrossRef MEDLINE PubMed Central
12.Brook RH, Ware JEJ, Davies-Avery A , et al.: . Overview of adult health measures fielded in Rand’s health insurance study. Med Care 1979 ; 17: 1–131.

Leserkommentare

E-Mail
Passwort

Registrieren

Um Artikel, Nachrichten oder Blogs kommentieren zu können, müssen Sie registriert sein. Sind sie bereits für den Newsletter oder den Stellenmarkt registriert, können Sie sich hier direkt anmelden.

Anzeige

Alle Leserbriefe zum Thema