Varianzunterschiede in klinischen Studien

Duisburg, Essen (2010), III, 100 Bl.
Dissertation / Fach: Medizin
Medizinische Fakultät » Universitätsklinikum Essen » Institut für Medizinische Informatik, Biometrie und Epidemiologie
Neuhäuser, Markus (Doktorvater, Betreuerin)
Jöckel, Karl-Heinz (GutachterIn)
Duisburg, Essen, Univ., Diss., 2010
Abstract:
Die hier vorgelegte Arbeit befasst sich im Wesentlichen mit Varianzunterschieden und Varianzfehlspezifikationen von Zielgrößen klinischer Studien.

Im Mittel und im Median waren nur sehr geringe Abweichungen der Varianz in der zweiten Hälfte realer Studien zu erkennen. Die vorgefundene Verteilung der Varianzquotienten unterschied sich jedoch signifikant von der unter der Annahme keines Unterschieds hergeleiteten theoretischen Mischverteilung. Grafische Methoden deuteten auf eine größere Anzahl an extremen Verhältnissen hin, was durch das 5%-Perzentil (Faktor 2/3) und das 95%-Perzentil (Faktor 1.8) bestätigt wurde. Die Untersuchung mit einem hierarchischen Modell korrigierte den Gesamtmittelwert der Verhältnisse der Standardabweichungen auf 1.03 und zeigte, dass Variablen innerhalb einer Studie zu gleichartigem Verhalten tendierten. Bei den erhobenen Eigenschaften könnte nur durch ungleichmäßige Rekrutierung (p=0.09) und Amendments (p=0.13) ein Einfluss auf die Varianzungleichheit vermutet werden.

Anschließend wurden statistische Eigenschaften von neuen Fallzahladaptionsprozeduren für normalverteilte (t-Test) und binäre (Chi-Quadrat-Test) Endpunkte unter der Nullhypothese keines Gruppenunterschieds bestimmt. Die Prozeduren sollten im Verlauf der Studie mehrfach und verblindet die Varianzannahme überprüfen und ggf. die Fallzahl korrigieren. Im Falle stetiger Endpunkte wurde das Niveau eingehalten, bei binären ist zu vermuten, dass die Liberalität des Chi-Quadrat-Tests für die Niveauverletzungen verantwortlich ist. Korrektur für Verblinden führte erwartungsgemäß zu einer leicht unterschätzten Fallzahl, Kontrollgrenzen für die Power verhinderten eine zu häufige Rekalkulation, bewirkten aber u.U. eine verzerrte Fallzahlschätzung. Abhängig vom Vorhandensein anderer Merkmale konnte die Variabilität der Fallzahl durch sie erhöht aber auch verringert werden. Mindestfallzahlen führten teilweise zu starker Überschätzung der Fallzahl, wirkten sich aber ansonsten nicht nachteilig aus. Die Auswirkungen für binäre Variablen konnten sich von denen für die stetigen unterscheiden.

Im dritten Teil wurde eine Möglichkeit der alternativen Auswertung von Studien vorgestellt, in denen eine Veränderung der Varianz der Zielgröße angenommen wurde. Anhand der Ergebnisse aus dem ersten Teil konnten verschiedene Szenarien Varianzinflation und/oder Mittelwertverschiebung über den Zeitverlauf einer Studie simuliert und der Fehler 1. und 2. Art der gewöhnlichen Pooling-Prozedur, des Kombinationstests von Fisher und einer Abschlusstestprozedur ermittelt werden. Keines der Verfahren verhielt sich antikonservativ. Die Prozeduren auf Basis des Kombinationstests wiesen verglichen mit der Poolingprozedur bei mittelgroßer Effektstärke eine um bis zu 7%-Punkte größere Power auf, bei veränderten Mittelwerten lagen sie bis zu 20%-Punkten höher. Bei großen und kleinen Effektstärken war der Vorteil dagegen gering, oder der Poolingtest war geringfügig besser.