Unterstützen Sie unsere Arbeit für Hirntumorpatienten. Vielen Dank!

Jetzt spenden

Dr. med. Ulrich Schwerdtfeger

Hier der Originalartikel, wie ich ihn in einem früheren Beitrag erwähnt hatte:

Edler, Lutz
Mistel in der Krebstherapie: Fragwürdige Ergebnisse neuerer klinischer Studien
Deutsches Ärzteblatt 101, Ausgabe 1-2 vom 05.01.2004, Seite A-44 / B-39 / C-39
MEDIZIN

Zusammenfassung
Publikation und wiederholtes Zitieren einer "retrospektiven" klinischen Studie zur Wirksamkeit der Misteltherapie bei Krebspatienten, vorgelegt von Grossarth-Maticek et al., sind Anlass einer Prüfung auf methodische Gültigkeit von Design und Auswertung. Geringe externe Validität, Mängel der biometrischen Auswertung, Informationsmängel und Möglichkeiten der Verfälschung der Studienergebnisse infolge der nur teilweise prospektiven "matched pairs"-Bildung und die Möglichkeit einer deutlichen Auswahlverzerrung lassen diese Studienergebnisse als sehr fragwürdig erscheinen. Vor dem Hintergrund von negativen randomisierten Studien zur Wirksamkeit der Misteltherapie sind die bisher in qualitativ geringer einzustufenden retrospektiven Studien erhaltenen positiven Ergebnisse nicht ausreichend für den Nachweis der Wirksamkeit.

Schlüsselwörter: Misteltherapie, Krebstherapie, Arzneimittelwirksamkeit, klinische Forschung, Therapiestudie


Summary
Mistle Toe in the Treatment of Cancer Patients: Questionable Results
of Recent Clinical Studies
The recent publication and repeated citation of a "retrospective" clinical study of Grossarth-Maticek et al. on the efficacy of mistle toe in the treatment of cancer patients and its intensive discussion initiated an examination of its validity. The new study results are found highly questionable from a methodological perspective due to low external validity, biostatistical deficiencies, missing information and possible selection biases from patient recruitment schemes and matched pairs generation. Considering the negative results of randomized prospective studies on mistle toe treatment newly published positive results from low quality retrospective studies are insufficient to establish efficacy of this alternative/complementary cancer treatment.

Key words: mistle toe, cancer therapy, drug efficacy, clinical research, clinical trial


Alternative beziehungsweise komplementäre Behandlungsverfahren werden bei Krebserkrankungen in großem Umfang durchgeführt und in noch weit größerem Maße in Erwägung gezogen (10). Unter den komplementären Therapien spielt die Misteltherapie eine besondere Rolle. Seit ihrer Einführung im Jahr 1920 durch Rudolf Steiner als anthroposophische medizinische Therapie wird ihre Wirksamkeit ohne befriedigende Antwort diskutiert (8). Dabei gibt es systematische klinische Studien bereits seit den 1960er-Jahren in Form von retrospektiven Datensammlungen, prospektiven Kohortenstudien mit und ohne parallel mitgeführter Kontrollgruppe und auch einige prospektive randomisierte kontrollierte klinische Studien. Bisher liegen vier nennenswerte Übersichtsarbeiten vor, die es gestatten, Mistelstudien nach dem Studientyp zu klassifizieren. Diese in Tabelle 1 genannten Reviews überlappen sich natürlich in der Auswahl der Studien, zeigen aber auch deutliche Unterschiede im methodischen Vorgehen. So beschränken sich beispielsweise Kleijnen und Knippschild (12) auf vergleichende prospektive Studien mit einer Kontrollgruppe während die anderen Autoren auch retrospektive Studien diskutieren. Bis Mitte der 1990er-Jahre gab es nach diesen Reviews insgesamt nur vier randomisierte klinische Studien zur Misteltherapie. Ein systematisches Review aller Mistelstudien fehlt bisher.
Vor dem Hintergrund der Nachzulassung eingeführter Medikamente in der EU und der Frage der Kostenerstattung für unbewiesene medizinische Verfahren sind in den letzten Jahren neuere Arbeiten zur Wirksamkeit der Misteltherapie erschienen (Tabelle 2). Von diesen wird insbesondere die Studie von Grossarth-Maticek et al. (6) mit ihren für Iscador "hoch signifikanten" positiven Ergebnissen in jüngster Zeit intensiv diskutiert. Außerdem wurde auf dem Deutschen Krebskongress in Berlin im Jahr 2002 ein Sondersymposium veranstaltet, auf welchem bisher noch nicht veröffentlichte Ergebnisse einer weiteren Studie zum Iscador vorgestellt wurden (1). Gleichzeitig gaben Stauder und Kreuser (18) einen Überblick über den Stand der klinischen Forschung zu Mistellektinen, und sie diskutieren dazu sechs klinische Studien mit der Schlussfolgerung, dass nur zwei Studien (19, 21) derzeit die erforderlichen Qualitätskriterien erfüllen, dass bislang aber auch keine Studie eine direkte Antitumorwirkung beziehungsweise eine Verbesserung des Krankheitsverlaufs oder Überlebens nachweisen konnte. Inzwischen liegt die im Original in englischer Sprache abgefasste Arbeit (6) auch in deutscher Sprache vor und wird auf vielfältige Weise werbend als Fachinformation für Ärzte verbreitet mit der deutlich ausgesprochenen Feststellung, die Wirksamkeit für Iscador in einer großen Studie nachgewiesen zu haben. In der Öffentlichkeit ist somit der Eindruck entstanden, dass neuere Studien die Wirksamkeit einer Misteltherapie nach wissenschaftlichen Prinzipien belegen. Parallel dazu wird eine spezielle Methodik der retrospektiven Datenauswertung als statistisch einwandfrei und als für einen Wirksamkeitsnachweis ausreichend dargestellt (1, 17), jeweils mit einem positiven Ergebnis für die Misteltherapie. Diese neue Methodik der so genannten epidemiologischen beziehungsweise retrolektiven Kohortenstudie wertet klinische Daten nach einem speziellen Design unter Verwendung spezieller statistischer Verfahren retrospektiv aus (16).
Unter methodischen Gesichtspunkten unterscheiden sich die Studien
von Grossarth-Maticek et al. (6) von denjenigen von Schumacher et al. (17) und Bock et al. (1) was die Wahl des Studiendesigns, die Auswerteverfahren und die Ergebnisdarstellung betrifft. Die beiden letztgenannten Autorengruppen definieren ein Datenerhebungs- und Auswerteschema und wenden statistisch anspruchsvolle Regressionsverfahren zur Adjustierung von Störgrößen an, können dadurch aber grundsätzliche Schwächen des retrospektiven Vorgehens nicht ausschließen (2). Dem gegenüber wählen Grossarth-Maticek et al. (6) aus einer großen Datenbank in mehreren Schritten immer kleinere Patientenkollektive unter Verwendung von Untergruppenanalysen und der Methode der "matched pairs". Während die eine Studie "prospektive nichtrandomisierte und randomisierte Matched-pair-Studie, eingebettet in eine Kohortenstudie" genannt wird, nennen sich die beiden anderen "epidemiologische, kontrollierte, multizentrische retrolektive Kohortenstudie". Selbst klinische Forscher, die sich bisher mit klinischen Studien und mit biometrischen Methoden der Planung und Durchführung klinischer Studien vertraut glaubten, werden diese Studien nur schwer einordnen können, zumal bekannte Begriffe wie prospektiv, randomisiert, kontrolliert und epidemiologisch auf eigenartige Weise vermengt erscheinen. Eines ist jedoch beiden Ansätzen gemeinsam: Es werden durchaus moderne biometrische Methoden angewendet mit dem Anspruch, endlich den kausalen Wirksamkeitsnachweis der Misteltherapie führen zu können. Die vorliegende Arbeit möchte einen Beitrag leisten, sowohl zur Klärung dieser methodischen Sachlage als auch zur Richtigstellung des Standes des Nachweises beziehungsweise des weiterhin fehlenden Nachweises der Wirksamkeit der Misteltherapie. Sie befasst sich dabei in erster Linie mit dem Problemkreis der Methodik der Studie von Grossarth-Maticek et al. (6). Zur Problematik der so genannten epidemiologischen Kohortenstudie in Bock et al. (1) und Schuhmacher et al. (17) und ihren methodischen Fallstricken sei auf eine weitere Arbeit des Autors (2) verwiesen.
Probleme retrospektiver Studien
Überwiegend waren die klinischen Studien zur Wirksamkeit der Misteltherapie bisher vom Typus einer retrospektiven Beobachtungsstudie, in der Patientendaten nach einem im nachhinein definierten Studienprotokoll quasi prospektiv auf Unterschiede zwischen den verabreichten Therapien ausgewertet wurden. Ein Spezialfall stellt die von Feinstein (4) eingeführte "retrolektive" Kohortenstudie dar, in der aus Sammlungen von Patientendaten und Krankheitsakten Therapieverläufe rekonstruiert werden und Therapien mittels eines zurückverlegten Anfangspunkts zwischen Patientenkohorten verglichen werden. Die retrolektive Kohortenstudie ähnelt stark einer epidemiologischen Fall-Kontroll-Studie, welche Faktoren der Vergangenheit (Risikofaktoren) auf ihre Assoziation mit dem Zustand der Gegenwart (Erkrankung) hin untersucht. In der retrolektiven Studie bilden die Therapieentscheidungen die Faktoren der Vergangenheit und die Therapieergebnisse (beispielsweise Überleben) die Zustände der Gegenwart. Sie bleibt in der üblichen Begriffsbildung der Methodik klinischer Studien jedoch eine retrospektive Studie, die nach Kriterien der evidenzbasierten Medizin in die Stufe 3, nach einer prospektiven Beobachtungsstudie (Stufe 2) und nach einer randomisierten kontrollierten klinischen Studie (RCT) (Stufe 1), einzuordnen ist. Daran ändert auch die Anwendung von Post-Stratifikation und die Gegenüberstellung von ähnlichen Patientenprofilen in der Kontroll- und Verumgruppe (Matchen), wie von Grossarth-Maticeck et al. (6) beschrieben, nichts. Die wesentliche Schwachstelle einer Beobachtungsstudie für den Nachweis der Wirksamkeit ist die Auswahl der Patienten für die Studie und die damit verbundene Möglichkeit einer Ergebnisverfälschung (Auswahlverzerrung, "bias"). Im Gegensatz zur RCT gibt es sowohl bei einer retrospektiven als auch bei einer prospektiven Beobachtungsstudie zwei Ursachen für eine Verfälschung von Ergebnissen (22):
- Unterschiede zwischen der Behandlungsgruppe und der Kontrollgruppe, die bei Nichtbehandlung (Kontrolle) beider Populationen offenbar würden. Hierbei handelt es sich um Differenzen in den beiden Gruppen, die bereits beim Behandlungsbeginn ("baseline") bestehen.
- Unterschiede in der Wirkung der Behandlung in beiden Populationen. So kann die Therapie bei den Patienten, die sich für eine Behandlungsgruppe entscheiden, anders wirken als wenn diese Patienten sich in der Kontrollgruppe befänden.
Die letztgenannte Art der Verfälschung tritt besonders dann auf, wenn aufgrund eines erwarteten Effekts eine bevorzugte Selektion in die Behandlungsgruppe eintritt. (Der Patient glaubt zu wissen, was für ihn gut ist und mit dieser eventuell prognostisch günstigen Eigenschaft, die schwer messbar ist, wählt er die Behandlungsgruppe und nicht die Kontrollgruppe). Grundsätzlich können diese Verfälschungen nur durch eine Zufallszuteilung (Randomisierung) ausgeschlossen werden. Die bereits erwähnten Formen der Verzerrung lassen sich auch auf eine andere Art beschreiben. Zum einen handelt es sich um eine offenkundige Verzerrung, welche durch unterschiedliche Werte der Kovariablen bei Studienbeginn entsteht und Unterschiede zwischen den Therapiearmen erzeugt. Matchen und Adjustierung nach diesen Ausgangswerten können diese Verzerrung zum Teil beseitigen. Ferner kann es sich um eine versteckte Verzerrung handeln, die auf Unterschieden bei Studienbeginn beruhen, die nicht beobachtet wurden beziehungsweise nicht beobachtbar sind. Diese können nicht durch statistische Verfahren beseitigt werden und bestenfalls im Rahmen von Sensitivitätsanalysen untersucht werden. Auch der Kunstgriff zum "propensity score" (die Wahrscheinlichkeit, dass der Patient in der Behandlungsgruppe ist) kann dieses Dilemma nicht lösen (2).
Problematik der Studie von Grossarth-Maticek et al.
Grossarth-Maticek et al. (6) berichten eine statistisch signifikante Verlängerung der Überlebenszeit durch die Iscadorbehandlung im Vergleich zur Kontrollgruppe. Die Studienergebnisse sind aufgeschlüsselt in eine nichtrandomisierte Teilstudie (NR) mit 396 "matched pairs" und in eine Teilstudie (R) mit 56 (39 plus 17) randomisierten Paaren ("matched pairs"), die eine Untergruppe von 34 (zweimal 17) Patientinnen mit Brustkrebs und Lymphknotenbefall enthält. Die Tabelle 3 zeigt diese schrittweise Konstruktion kleiner Teilstudien aus verschiedenen Datensammlungen. Die gesamte Studienpopulation von 904 Patienten stammt aus vier Datensammlungen, die zwischen 1971 und 1988 in Heidelberg und in zwölf weiteren Kliniken in Deutschland erstellt wurden. Von insgesamt 11 009 rekrutierten Krebspatienten kamen 10 226 Patienten in die Untersuchung. Bei Abschluss der Studie 1998 waren darunter 1 751 Patienten, die eine Misteltherapie erhalten hatten (1 688 mit Iscador) und 8 475 Patienten ohne Misteltherapie. Aus dieser Population wurden zwischen 1977 und 1988 "matched pairs" gebildet, sowohl 622 nichtrandomisierte Paare, von denen nur 396 Paare ausgewertet wurden, als auch 66 randomisierte Paare, von denen 56 Paare ausgewertet wurden. Die Randomisierung der Teilstudie verlief so, dass jeweils ein Patient eines Paares in eine Gruppe randomisiert wurde, welche ihren Arzt um eine Behandlung mit Iscador bitten sollte. Ein "Kandidat für eine Iscadorbehandlung [wurde] ausgewählt, indem der Studienleiter zwei Zettel mit je einem Namen der beiden Patienten in eine Mütze legte und ein maskierter Mitarbeiter dann einen der beiden Namenszettel herauszog" ([6] Seite 59; in der deutschen Übersetzung Seite 7). Für weitere Einzelheiten zur Rekrutierung und zum Matchen sei auf die Originalarbeit verwiesen. In insgesamt zehn Teilstudien mit 904 (8,8 Prozent) Patienten zeigten sich Unterschiede in der Gesamtüberlebenszeit zugunsten von Iscador zwischen 0,48 und 2,38 Jahren, die alle statistisch signifikant (p < 0,05) waren.
In der Berichterstattung wird oft fälschlicherweise die Anzahl von 11 009 rekrutierten Patienten oder die Anzahl von circa 1 000 ausgewerteten Patienten als Fallzahl genannt. Dies ist irreführend: Erstens macht die Anzahl der 452 "matched pairs" die echte Fallzahl dieser Studie aus und zweitens sind in der Gesamtzahl verschiedene Tumortypen und verschiedene Krankheitsstudien zusammengefasst, die jede für sich Gegenstand einer Studie sein sollten. Die größte Teilstudie dieser Untersuchung ist die zum Kolonkarzinom mit lediglich 90 Paaren. Die echten Fallzahlen dieser Untersuchung liegen also unter einem Zehntel von dem was berichtetet wird (siehe rechte Spalte in Tabelle 3). Im Folgenden soll vorwiegend die als randomisiert bezeichnete Teilstudie (R) als symptomatisch für die gegenwärtige Diskussion der Misteltherapie untersucht werden.
Ethische Absicherung unzureichend
Die Studie erfolgte nicht unter den Bedingungen der Deklaration von Helsinki und fand in einer ethischen Grauzone statt, wenn beispielsweise die Patienten gebeten wurden, ihren Arzt um eine bestimmte Behandlung zu bitten: "to ask their doctors" ([6] Seite 7). Man muss fragen, welche Abhängigkeitsverhältnisse zwischen den Untersuchern dieser Studie, den Patienten und den behandelnden Ärzten vorlagen und ob Patientenrechte beeinträchtigt wurden. Gab es eine Altersbeschränkung zur Aufnahme in diese Studie? Lag eine Einwilligung zur möglichen Weitergabe der Daten vor? Waren alle Daten anonymisiert? Wie wurde bei anonymisierten Daten die Paarbildung vorgenommen?
Geringe externe Gültigkeit
Eine Planung der Studie im Sinne von "good clinical practise" (GCP) liegt nicht vor. In der Veröffentlichung heißt es: "A multitude of prospective non-randomized and randomized matched-pairs studies were nested into a cohort study of 10 226 cancer patients" ([6] Seite 58). Selbstregulation war bei der Planung der Studie ein wichtiger prognostischer Faktor, wurde aber nicht prospektiv als Stratum in die Planung aufgenommen, um beispielsweise vergleichbare Fallzahlen pro Stratum zu erhalten und um statistisch korrekt innerhalb der Strata zu testen. Abgesehen vom Matchen wurden Patienten nicht nach Klinik oder weiteren Merkmalen ihrer klinischen Vorgeschichte stratifiziert. Des Weiteren fehlen in der Publikation Angaben zu einem Studienprotokoll und den Erhebungsinstrumenten. Es existiert weder eine Fallzahlplanung noch eine prospektive Festlegung auf spezifische Fragestellungen und Hypothesen zu Behandlungseffekten. Vielmehr hat es den Anschein, dass Fragestellungen erst mit dem Fortgang der Untersuchungen und dem Anwachsen der Datensammlung entwickelt wurden. Auch wurde nicht erklärt, warum bei der hohen Ausgangszahl von mehr als 10 000 Probanden nur eine so kleine Anzahl von Paaren gebildet wurde. Die Studienpopulation setzt sich aus mindestens vier verschiedenen sich zeitlich überlappenden Teilpopulationen zusammen, sodass Überlappungen und ein Mehrfacheinschluss von Patienten nicht ausgeschlossen werden kann. Damit fehlt dieser Studie die Wiederholbarkeit. Mit 102 (zweimal 56) randomisiert ausgewerteten Fällen liegt die Auswahlrate bei 1Prozent und ist so gering, dass eine Verallgemeinerung des Studienergebnisses sich schon numerisch verbietet. Eine externe Gültigkeit ist angesichts dieser niedrigen Prozentsätze nicht gegeben.
Methodische Standards nicht erfüllt
Die Bildung von "matched pairs" ist nach der Beschreibung in der Publikation im Grunde nicht nachvollziehbar: Es wird nicht angegeben, aus welcher prospektiv definierten Population zu welchem Zeitpunkt zwischen 1971 und 1988 Paare gebildet wurden. In einer vorhergehenden Fassung, die in der Originalarbeit allerdings fehlt, heißt es: "The pairing was done progressively each year" und "In each case it was checked that the previously recruited twin was still alive at the time of pairing". Das möglicherweise Fehlen strenger zeitlicher Regeln für das Matchen macht eine Selektionsverzerrung wahrscheinlich, insbesondere dann, wenn ein Fall lange auf seinen Paarling warten musste. In der Arbeit werden etwa 40 Prognosefaktoren (Tumortypen und Stadien) angegeben. Setzt man diese Faktoren mit der Anzahl ihrer möglichen Ausprägungen in ein vollständiges Matching-Schema um, so erhält man die unglaublich große Zahl von mehr als 250 Klassen. Das Verfahren kann also nicht wie in der Publikation beschrieben abgelaufen sein und es ist vorstellbar, dass Paare nach unterschiedlichen Kriterien gematched wurden. Nicht ausgeschlossen ist so eine Selektion von prognostisch ungünstigeren Kontrollpatienten aus einem Patientenpool, der sich bis zum aktuellen Zeitpunkt der Paarbildung irgendwann zwischen 1977 und 1988 angesammelt hatte. Wurde bei der Paarbildung beispielsweise auf frühere Kontrollen zurückgegriffen, die noch lebten, deren Krakheit aber schon weit fortgeschritten war, ein Vorteil für die Behandlungsgruppe. Eine Klärung dieses Sachverhalts ist aber schwierig, da die Paarbildung im Mittel etwa 20 Jahre zurückliegt und man nicht erwarten kann, dass alle Ereignisse und Möglichkeiten, die auf eine Paarbildung Einfluss haben, protokolliert und in der Studiendokumentation nachprüfbar niedergelegt sind. Dies ist auch bei prospektiven GCP-Studien nicht einfach. Im Fall dieser Studie kann nicht ausgeschlossen werden, dass Daten von Kontrollpatienten mehrfach benutzt wurden, zumal in dem genannten früheren Manuskript bemerkt wurde, dass "one control patient could serve as a multiple control in several studies". Somit ist denkbar, dass ein Patient sowohl als Kontrollfall als auch als Behandlungsfall auftaucht, was jede statistische Auswertung korrumpiert.
Die Methode der "matched pairs" ist aber auch aus grundsätzlichen Überlegungen heraus anfällig für eine Selektionsverzerrung. Eine Selektion zugunsten von Iscador ist zum Beispiel möglich, wenn der Iscador-Paarling beim Warten auf das Matching wegen schlechter Prognose ausfällt. Es ist dann möglich, dass ein prognostisch günstiger Kontroll-Paarling aus der Studie ausgeschlossen wird, oder aber dass der prognostisch ungünstige Iscador-Paarling durch einen prognostisch günstigeren ersetzt wird. Dies wird besonders dann zum methodischen Problem, wenn nach vielen Faktoren gepaart wird. Die Auswahl der Paare bedingt auch, dass Patienten mit einer kurzen Überlebenszeit nach Diagnose eine viel kleinere Chance haben, überhaupt in die Studie aufgenommen zu werden und sie haben eine noch kleinere Chance, mit einem "Zwilling" gepaart zu werden. Patienten mit längerer Überlebenszeit haben dagegen eine große Chance, in die Studie aufgenommen zu werden. Beim Warten auf das Matching besteht die Gefahr, dass bewusst oder unbewusst Patienten in die Kontrollgruppe gewählt werden, die extrem kurze Überlebenszeiten haben. Diese Auswahlverzerrung kann ein Grund für die beobachteten extrem großen Unterschiede zwischen Iscador und Kontrolle sein. Solange nicht alle Zeitpunkte der Diagnose, Rekrutierung und des Todes überprüfbar dokumentiert sind, kann eine starke Auswahlverzerrung zugunsten von Iscador nicht ausgeschlossen werden. Korrektheit der Mortalitätsraten wurde für Teilstudien, aus denen einige dieser Patienten rekrutiert wurden, bereits in einem anderen Zusammenhang infrage gestellt (5, 20). Selbst wenn diese Kontroverse nach zehn Jahren noch nicht beigelegt zu sein scheint (siehe http://www.grossarth-maticek. de/seiten/ seite_kritik.html) ist es legitim, bei dieser einen so langen Zeitraum umfassenden Studie die Frage der Datenqualität und Korrektheit der Daten im Sinne der GCP zu stellen.
Therapie nicht beurteilbar und nicht nachvollziehbar
Behandlungen wurden in dieser Studie nicht individuell beurteilt. Die Dauer der Iscadorbehandlung ist nicht dokumentiert, abgesehen von der Angabe einer "duration of treatment relative to survival time" ([6] in den Tabellen 6 und 7). Wie kann ausgeschlossen werden, dass die Patienten, welche in den Arm "Nachfrage nach Iscador" eingeteilt wurden, nicht besser behandelt wurden als diejenigen Patienten, welche nicht zum Arzt "geschickt" wurden? Welche Behandlungen wurden in der Kontrollgruppe angewendet? Wurden Kontrollpatienten ausgeschlossen, sobald sie Mistel bekamen, erfolgte mit hoher Wahrscheinlichkeit eine Negativselektion in die Kontrollgruppe. In der Arbeit wird die Behandlungsdauer in Form eines Prozentsatzes von Behandlungszeit, gemessen an der Überlebenszeit, quantifiziert und als Einflussgröße behandelt. Es ist verwunderlich, dass dabei ein Trend zu längeren Überlebenszeiten mit steigendem Behandlungsanteil sichtbar wird, da durch diese Relativierung Patienten mit kurzer Lebensdauer eine hohe relative Behandlungsdauer zugewiesen bekommen und mit solchen zusammengefasst werden, die lange während der Therapie überlebten. Dies legt die Vermutung nahe, dass Patienten, welche lange Iscador bekamen, bevorzugt - retrospektiv gesehen - in die Studie aufgenommen wurden. Gleichzeitig widerspricht dies einer Aussage in der Publikation an anderer Stelle, nach der die Behandlungsdauer nicht bekannt war. Man weiß auch nicht, in welchen Kliniken die Patienten behandelt wurden und wie die Diagnosen zustande kamen, geschweige denn, ob nach Kliniken, Krebserkrankungen und Stadien selektiert wurde.
Statistische Auswertung zeigt Mängel
Überlebenszeit wurde ab dem Diagnosedatum und nicht ab der Behandlung gemessen. Dies verletzt das "intent to treat"-Prinzip. Gleichzeitig sind damit die Ergebnisse nicht mit anderen onkologischen Therapiestudien vergleichbar, und eine Tendenz zur Beobachtung längerer Überlebenszeiten ist verständlich. Unzulässig ist auch die Berechnung von arithmetischen Mittelwerten bei Überlebenszeiten, weil zensierte Daten vorliegen, von statistischen Verteilungsgründen ganz zu schweigen. Anstelle einer multivariaten Überlebenszeitanalyse, die inzwischen zum Standard jeder großen klinischen Studien gehört, werden Untergruppenanalysen durchgeführt mit der bekannten Problematik multipler Vergleiche.
Weitere randomisierte Studien notwendig
Patienten, die eine komplementäre Behandlung wählen, unterscheiden sich in wichtigen soziodemographischen Eigenschaften. Pampallona et al. (15) konnten deutliche Unterschiede aufzeigen in Bezug auf Geschlecht, Alter, Schulbildung und Lebensraum. So haben mehr Frauen, jüngere Patienten, Patienten mit höherer Schulbildung und solche, die in städtischer Umgebung wohnen, die Lucas-Klinik in Arlesheim aufgesucht und mehr Männer, ältere Patienten mit niedrigerer Schulbildung aus der eher ländlichen Gegend das Universitätsspital in Bern. Diese Unterschiede waren groß und auffallend war auch eine ungleiche Verteilung der Tumorerkrankungen in den beiden Kliniken. Eine Selbstselektion von Patienten mit längeren Überlebenszeiten in die Klinik mit komplementärer Behandlung kann somit in diesem Fall ebenso wenig ausgeschlossen werden wie in der bereits betrachteten Studie von Grossarth-Maticek. Bei den Patienten der Studie unter der Leitung von Pampallona et al. ist auch eine längere Zeitspanne zwischen Diagnose und Aufnahme zu verzeichnen, die mit einer besseren Prognose korreliert sein könnte (15). Gleichzeitig ist diese längere Zeitdauer mit einer höheren Behandlungsrate mit konventioneller Chemotherapie während des vorausgegangenen Krankheitsverlaufs assoziiert. Selbst große Unterschiede können so durch Unterschiede zwischen den Patientenpopulationen erklärt werden. Anzumerken ist, dass derartige soziodemographische Unterschiede zwischen den Therapiegruppen eine Beurteilung der subjektiv beeinflussten Zielgröße der Lebensqualität zwischen komplementär und konventionell behandelten Patienten methodisch außerordentlich fragwürdig macht.
Die diskutierten Schwächen, Fehler und Möglichkeiten von statistischer Ergebnisverzerrung und die vielen offenen Fragen zum Design und zur Auswertung der Studie von Grossarth-Maticek et al. sollten hinreichend deutlich gemacht haben, dass diese Ergebnisse viel zu fragwürdig sind als dass der Mistel eine gesicherte Rolle in der Therapie onkologischer Erkrankungen zugewiesen werden kann. Weitere, gut geplante, randomisierte klinische Studien sind notwendig, um die behaupteten positiven Ergebnisse vor allem hinsichtlich einer Verbesserung der Lebensqualität zu beweisen. Dann ist aber immer noch offen, ob solche Studien in der Lage sind, das in mindestens zwei korrekt durchgeführten randomisierten Studien (3, 19) beobachtete Fehlen einer Wirksamkeit zu widerlegen. So stellt auch A. Loewe-Mesch von der Frauenklinik der Universität Heidelberg in einer der Misteltherapie grundsätzlich eher positiv formulierten Übersicht fest (Erfahrungsheilkunde 2002; Heft 4, Seite 256): "Bislang konnte kein sicherer Wirksamkeitsnachweis von Mistelpräparaten erbracht werden. Auch der sichere Nachweis einer längeren Überlebenszeit oder Rezidivfreiheit steht noch aus."

zZitierweise dieses Beitrags:
Dtsch Arztebl 2004; 101: A 44-49 [Heft 1-2]

Anschrift des Verfassers:
Dr. rer. nat. Lutz Edler
Abteilung Biostatistik C060
Deutsches Krebsforschungszentrum
Im Neuenheimer Feld 280
69120 Heidelberg

Antworten nur für eingeloggte Benutzer möglich

Nur angemeldete Nutzer können eine Antwort erstellen. Bitte loggen Sie sich ein oder erstellen Sie einen Account.