Tagesspezifische Wahrscheinlichkeiten der klinischen Schwangerschaft auf der Grundlage von zwei Studien mit unvollkommener Messung des Eisprungs
On November 24, 2021 by adminAbstract
Zwei Studien haben den Zeitpunkt des Geschlechtsverkehrs (relativ zum Eisprung) mit der tagesspezifischen Fruchtbarkeit in Verbindung gebracht. Bei der ersten handelte es sich um eine Studie mit katholischen Paaren, die in den 1950er und 1960er Jahren in London natürliche Familienplanung praktizierten, bei der zweiten um eine Studie mit Paaren aus North Carolina, die Anfang der 1980er Jahre versuchten, schwanger zu werden. In der ersten Studie wurde der Eisprung anhand der ovulatorischen Verschiebung der Basaltemperatur ermittelt, während in der zweiten Studie Hormonbestimmungen im Urin vorgenommen wurden. Wir verwenden ein statistisches Modell, um Fehler bei der Identifizierung des Eisprungs zu korrigieren und die Länge des fruchtbaren Fensters sowie die tagesabhängigen Fruchtbarkeitsraten neu zu schätzen. Nach der Fehlerkorrektur schätzen wir in beiden Studien das gleiche 6-tägige fruchtbare Intervall. Nach der Fehlerkorrektur zeigten beide Datensätze die höchste Schätzung der Schwangerschaftswahrscheinlichkeit am Tag vor dem Eisprung und beide fielen nach dem Eisprung gegen Null. Da das fruchtbare Intervall vor dem Eisprung liegt, wären Methoden, die den Eisprung um mehrere Tage vorwegnehmen (wie z. B. die Beurteilung des Zervixschleims), besonders nützlich für Paare, die ihren Geschlechtsverkehr zeitlich so planen wollen, dass eine Empfängnis entweder vermieden oder erleichtert wird.
Einführung
Zwei große prospektive Studien liefern Daten zur Schätzung der Wahrscheinlichkeit einer klinisch nachweisbaren Schwangerschaft bei Geschlechtsverkehr an bestimmten Tagen des Menstruationszyklus im Verhältnis zum Eisprung. An der ersten Studie nahmen verheiratete britische Paare in den 1950er und 1960er Jahren teil, die die Basaltemperaturmethode (BBT) zur natürlichen Familienplanung anwandten (Barrett und Marshall, 1969). Die Daten wurden an den Tagen des Geschlechtsverkehrs erhoben, und der Tag des Eisprungs wurde als der letzte Tag der Unterkühlung angenommen (geschätzt anhand der auf die täglichen BBT-Messungen angewandten Coverline-Regel) (Barrett und Marshall, 1969). Insgesamt lieferten 241 Paare verwertbare Daten.
Die zweite Studie wurde Anfang der 80er Jahre mit 221 gesunden Paaren aus North Carolina durchgeführt, die versuchten, schwanger zu werden, und eingeschrieben wurden, als sie ihre Verhütungsmittel absetzten (Wilcox et al., 1988). Jeden Tag notierten die Frauen, ob sie Geschlechtsverkehr hatten oder nicht, und sammelten eine Urinprobe vom ersten Morgen. Der Tag des Eisprungs wurde anhand des raschen Rückgangs des Verhältnisses von Östrogen zu Progesteron geschätzt, der mit der Luteinisierung des Ovarialfollikels einhergeht und auf Hormonmetaboliten im Urin beruht (Baird et al., 1991). Diese auf Steroiden basierende Schätzung des Ovulationsdatums wird als „Tag des lutealen Übergangs“ (DLT) bezeichnet.
Daten aus diesen Studien wurden zur Schätzung der tagesspezifischen Wahrscheinlichkeiten einer klinischen Schwangerschaft und der Länge des fruchtbaren Intervalls verwendet. Tagesspezifische Schwangerschaftswahrscheinlichkeiten (Royston, 1982) wurden auf der Grundlage der Daten von Barrett und Marshall (Barrett und Marshall, 1969) und unter Verwendung eines früheren Modells (Schwartz et al., 1980) ermittelt. Die geschätzte Eintageswahrscheinlichkeit steigt auf einen Spitzenwert von 0,36, 2 Tage vor dem letzten Tag der Unterkühlung. Geschlechtsverkehr bereits 8 Tage vor dem letzten Tag der Unterkühlung und bis zu 3 Tage danach führte offenbar zu einer Schwangerschaft. Ein ähnliches Muster, jedoch mit einem kürzeren Intervall und niedrigeren Schätzwerten, wurde berichtet (Wilcox et al., 1998). Die geschätzten eintägigen Schwangerschaftswahrscheinlichkeiten erreichen ihren Höhepunkt 2 Tage vor dem geschätzten Tag der Ovulation. Das scheinbar fruchtbare Intervall erstreckt sich von ~5 Tagen vor dem DLT bis zum DLT.
Diese Schätzungen sind empfindlich gegenüber Fehlern bei der Ermittlung des Eisprungdatums (Bongaarts, 1983). Um dies zu veranschaulichen, stellen Sie sich vor, dass eine Schwangerschaft nur bei Geschlechtsverkehr am Tag des Eisprungs möglich ist und an allen anderen Tagen mit Nullwahrscheinlichkeit. Wenn ein Fehler bei der Schätzung des Ovulationstages auftritt, wird der geschätzte Tag bei einem Teil der Zyklen um ⩾1 Tage gegenüber dem wahren Tag verschoben sein. Einige Schwangerschaften scheinen auf Geschlechtsverkehr vor oder nach dem Eisprung zurückzuführen zu sein. Das offensichtliche Muster ist folglich verschmiert, wodurch das geschätzte fruchtbare Intervall artefaktisch verlängert wird. Wenn ein solcher Fehler korrigiert werden könnte, würden die Schätzungen der tagesspezifischen Wahrscheinlichkeiten genauer, und Studien, die verschiedene Marker für den Eisprung verwenden, könnten aussagekräftiger verglichen werden.
Dunson und Weinberg haben das Standard-Fertilitätsmodell erweitert, um Messfehler bei der Identifizierung des Eisprungstages zu berücksichtigen (Dunson und Weinberg, 1999a). Sie schlagen ein semiparametrisches Bayes’sches Mischmodell vor, mit dem die Verteilung der Messfehler geschätzt und die Schätzungen der Fertilitätsparameter um diese Fehler korrigiert werden können. In der vorliegenden Arbeit wird dieser Ansatz auf die Analyse der beiden Fertilitätsstudien angewandt, um: (i) die Leistung der BBT- und DLT-Messungen des Eisprungs zu vergleichen; (ii) die tagesspezifischen Schwangerschaftswahrscheinlichkeiten zu schätzen und das fruchtbare Fenster zu identifizieren, wobei Fehler bei der Messung des Eisprungs kontrolliert werden; und (iii) die beiden Muster der tagesspezifischen Schwangerschaftswahrscheinlichkeiten zu vergleichen.
Materialien und Methoden
Beschreibung der Studienpopulationen und der Zyklusauswahl
Die Merkmale der beiden in dieser Analyse verwendeten Studienpopulationen sind in Tabelle I zusammengefasst. Die Stichprobe der Studie von Barrett und Marshall bestand aus britischen Ehepaaren, die bei Studienbeginn mindestens ein Kind hatten (Barrett und Marshall, 1969). Von den Frauen waren 90 % zwischen 20 und 39 Jahre alt, der Rest war zwischen 40 und 50 Jahre alt. Die Paare wurden rekrutiert, nachdem sie sich beim Catholic Marriage Advisory Council über natürliche Familienplanung hatten beraten lassen. Die meisten versuchten zu Beginn der Nachbeobachtung, eine Schwangerschaft zu vermeiden. Eine unbekannte Zahl von Frauen, die regelmäßig schwer zu interpretierende Temperaturdiagramme erstellten, wurde von der Studie ausgeschlossen, ebenso wie einzelne Zyklen, bei denen der Tag des Eisprungs nicht identifiziert werden konnte. Die verwertbaren Daten umfassten 2192 Menstruationszyklen von 241 Frauen. In 103 Zyklen wurde eine Schwangerschaft festgestellt.
Die Stichprobe der Wilcox-Studie (Wilcox et al., 1988) bestand aus Frauen aus North Carolina, die eine Schwangerschaft planten und keine schweren chronischen Krankheiten oder Fruchtbarkeitsprobleme aufwiesen. Die Mehrheit der Frauen hatte einen Hochschulabschluss (71 %) und war weiß (96 %). Ein Drittel war nulliparous und 80 % waren zwischen 26 und 35 Jahre alt. Nur eine Frau war >40 Jahre alt. Die Daten umfassten 740 Menstruationszyklen von 221 Frauen. In 199 dieser Zyklen wurde eine Schwangerschaft chemisch nachgewiesen. Von diesen Schwangerschaften wurden 48 als frühe Verluste definiert, da sie innerhalb von 6 Wochen nach der letzten Menstruation endeten. Die übrigen 151 Schwangerschaften überlebten so lange, dass sie mit den von Barrett und Marshall verwendeten Methoden wahrscheinlich entdeckt worden wären. Diese werden als klinische Schwangerschaften bezeichnet. Wir haben die Analyse der North-Carolina-Studie auf diese 151 klinischen Schwangerschaften beschränkt (frühe Verluste wurden als Nicht-Konzeptionszyklen behandelt), um die beiden Studien vergleichbar zu machen. Außerdem beschränkten wir die Analyse auf Menstruationszyklen, für die ein Tag des Eisprungs ermittelt werden konnte und in denen keine relevanten Daten zum Zeitpunkt des Geschlechtsverkehrs fehlten. Damit blieben 674 der ursprünglich 740 Zyklen (91 %) und 141 der 151 klinischen Schwangerschaften (93 %) übrig.
Analysemethode: Modellierung der Schwangerschaftswahrscheinlichkeit
Spermien können im weiblichen Fortpflanzungstrakt mehrere Tage oder länger lebensfähig bleiben (Perloff und Steinberger, 1964). Wenn also an mehreren Tagen eines Menstruationszyklus Geschlechtsverkehr stattfindet und eine Schwangerschaft eintritt, kann der spezifische Tag des Geschlechtsverkehrs, der für diese Schwangerschaft verantwortlich ist, nicht mit Sicherheit bestimmt werden.
Eine Methode zur Schätzung der täglichen Wahrscheinlichkeiten einer klinischen Schwangerschaft, die auf der Annahme beruht, dass sich die an verschiedenen Tagen in den Fortpflanzungstrakt eingeführten Spermienpartien vermischen und unabhängig voneinander konkurrieren, wurde vorgeschlagen (Barrett und Marshall, 1969). Nach diesem Modell ist die Wahrscheinlichkeit einer Schwangerschaft in einem bestimmten Zyklus:
wobei Xjk ein Indikator für Geschlechtsverkehr am Tag k des Zyklus j ist, j = 1,…, J, und pk als die Wahrscheinlichkeit interpretiert werden kann, dass eine Schwangerschaft nur bei Geschlechtsverkehr am Tag k eintreten würde.
Das Modell von Barrett und Marshall berücksichtigt nur die zeitlichen Auswirkungen des Geschlechtsverkehrs. Dieses Modell wurde erweitert (Schwartz et al., 1980), damit die Wahrscheinlichkeit einer klinischen Schwangerschaft auch von Faktoren abhängt, die nicht mit dem Zeitpunkt des Geschlechtsverkehrs zusammenhängen. Diese Faktoren werden in einem Parameter (A) zusammengefasst, der als Wahrscheinlichkeit der Zyklusdurchführbarkeit bezeichnet wird und die Wahrscheinlichkeit darstellt, dass die Gesamtheit aller Faktoren, die nicht mit dem Zeitpunkt des Geschlechtsverkehrs zusammenhängen, eine klinische Schwangerschaft begünstigen.
Eine Komplikation bei diesen Studien besteht darin, dass die meisten Paare mehr als einen Menstruationszyklus zum Datensatz beisteuern, und es gibt Anzeichen für eine Heterogenität unter den Paaren, da einige Paare eine höhere Wahrscheinlichkeit der Zyklusdurchführbarkeit haben. Dies führt zu einer statistischen Abhängigkeit in den Daten. Außerdem tragen weniger fruchtbare Paare mehr Zyklen zum Datensatz bei und verzerren daher die Schätzungen der mittleren Fruchtbarkeit. Es wurde ein Modell mit zufälligen Effekten vorgeschlagen (Zhou et al., 1996), das die Abhängigkeit innerhalb der Paare bei der Zyklusdurchführbarkeit berücksichtigt. Ein ähnliches Modell wird in dieser Arbeit in die Schätzung einbezogen.
Korrektur von Fehlern bei der Schätzung des Tages des Eisprungs
Die meisten Modelle gehen implizit davon aus, dass der Tag des Eisprungs ohne Fehler gemessen wird. Wenn Marker für den Eisprung fehleranfällig sind, ist der Zeitindex `k‘ (der den Tag relativ zum Eisprung bezeichnet) nicht genau bekannt. Eine Folge davon ist, dass Studien mit unterschiedlichen Methoden zur Schätzung des Eisprungs keine äquivalenten „k“-Parameter schätzen, was die Vergleichbarkeit zwischen den Studien einschränkt. In einem Zyklus, in dem der Tag des Eisprungs falsch geschätzt wurde, liegt die Zeit zwischen dem tatsächlichen und dem zugewiesenen Tag des Eisprungs einen oder mehrere Tage. Das Modell von Zhou et al. (1996) wurde erweitert (Dunson und Weinberg, 1999a), um diesen Fehlern Rechnung zu tragen, indem die Parameter πl aufgenommen wurden, die die Wahrscheinlichkeit einer Verschiebung des zugewiesenen Ovulationstages um l Tage gegenüber dem wahren Ovulationstag angeben. Wir erläutern dieses Modell ausführlicher in Anhang I.
Im Grunde genommen wäre „Tag 0“ als der wahre Tag des Eisprungs zu interpretieren, nachdem der Messfehler bereinigt wurde. Dies wäre der Fall, wenn der anhand des Markers zugewiesene Tag des Eisprungs nicht systematisch vom wahren Tag des Eisprungs abweicht. Es gibt Hinweise darauf, dass der Spitzenwert des luteinisierenden Hormons (LH) im Urin (Collins et al., 1983; France et al., 1992) und der letzte Tag der Unterkühlung (France et al., 1992) im Durchschnitt beide nahe am Eisprung liegen. Der DLT wurde anhand eines Algorithmus ermittelt, der so konzipiert wurde, dass er mit dem Tag des LH-Höchststandes im Urin übereinstimmt (Baird et al., 1991). Somit sollten sowohl der DLT als auch der letzte Tag der Unterkühlung im Durchschnitt den wahren Tag des Eisprungs mit geringer systematischer Abweichung annähern.
Kombinieren der beiden Studienpopulationen
Nachdem die Geschlechtsverkehrsindikatoren aus beiden Studien mit dem entsprechenden geschätzten Tag des Eisprungs indexiert wurden, kann eine kombinierte Analyse der beiden Datensätze durchgeführt werden. Wir müssen jedoch auch die Möglichkeit in Betracht ziehen, dass sich die Fruchtbarkeit der Paare zwischen den Stichproben unterscheidet.
Wir beginnen mit einer separaten Analyse jedes Datensatzes und vergleichen die Parameter der Zykluslebensfähigkeit (A) und die eintägigen Schwangerschaftswahrscheinlichkeiten. Um die Ergebnisse der beiden Studien statistisch vergleichen zu können, haben wir weitere vereinfachende Annahmen getroffen. Auf der Grundlage der Ergebnisse der getrennten Analysen jedes Datensatzes können wir eine vereinfachte kombinierte Analyse erstellen, indem wir eine Teilmenge der Parameter so einschränken, dass sie in beiden Studien gleich sind, während wir gleichzeitig spezifische Unterschiede zwischen den beiden Kohorten berücksichtigen. Jeder Kohorte wird eine eigene Fehlerverteilung zugestanden. Die Leistung der beiden Ovulationsmaße kann verglichen werden, indem auf einen Unterschied im geschätzten Anteil der Zyklen getestet wird, in denen der Eisprung ohne Fehler zugeordnet wurde.
Wir analysieren zunächst jeden Datensatz separat mit dem von Dunson und Weinberg (1999a) vorgeschlagenen Algorithmus. Wir beschränken die Wahrscheinlichkeit einer Schwangerschaft aufgrund von Geschlechtsverkehr außerhalb eines breiten potenziell fruchtbaren Fensters auf Null. Wir wählen das potenziell fruchtbare Fenster auf der Grundlage der Maximum-Likelihood-Schätzungen des Schwartz-Modells, das keine Anpassung für Messfehler vornimmt (Schwartz et al., 1980), unter der Annahme, dass das wahre Fenster innerhalb des scheinbaren Fensters liegen sollte. Alle Tage mit geschätzten (Schwartz-Modell) eintägigen Schwangerschaftswahrscheinlichkeiten (Apk) >0,01 werden in das Fenster einbezogen.
Auf der Grundlage dieses Kriteriums erstreckt sich das potenziell fruchtbare Fenster für die Barrett- und Marshall-Kohorte über das 9-Tage-Intervall von 7 Tagen vor bis 1 Tag nach dem letzten Tag der Unterkühlung. In der Studie von Wilcox et al. beträgt das Fenster 6 Tage und reicht von 5 Tagen vor bis zum Tag der DLT.
Das potenziell fruchtbare Fenster für die kombinierte Analyse wird auch auf der Grundlage von Schätzungen für die eintägigen Wahrscheinlichkeiten einer klinischen Schwangerschaft (d. h. Apk) ermittelt. Da das Modell davon ausgeht, dass die tagesspezifischen Wahrscheinlichkeiten >0 sind, müssen wir einen Grenzwert festlegen, um die Breite des fruchtbaren Intervalls einzuschränken. Tage werden in das fruchtbare Fenster aufgenommen, wenn die untere Konfidenzgrenze für die Wahrscheinlichkeit einer klinischen Schwangerschaft >0,01 oder der Punktschätzer >0,035 ist. Nach dem Vergleich der Ergebnisse, die auf getrennten Analysen der beiden Kohorten beruhen, nehmen wir ein einfacheres Modell für eine gemeinsame Analyse an: Dieses Modell geht davon aus, dass die tagesspezifischen pk-Parameter für die beiden Kohorten gleich sind, lässt aber zu, dass die Kohorten separate Zykluslebensfähigkeitsparameter haben. Für jede der beiden Methoden zur Bestimmung des Eisprungs ist eine eigene Fehlerverteilung zulässig.
Ergebnisse
Unter Verwendung der oben beschriebenen Methoden haben wir die Messfehlerverteilungen geschätzt, die sowohl dem BBT-basierten Marker des Eisprungs als auch dem hormonbasierten Marker des Eisprungs entsprechen. Die geschätzten Fehlerverteilungen sind in Abbildung 1 dargestellt. Es zeigt sich, dass die hormonbasierte Messung weniger Fehler aufweist als die BBT-basierte Messung. Nach diesen Schätzungen sind 60 % der mit dem DLT geschätzten Tage des Eisprungs korrekt, verglichen mit 43 % der mit dem BBT geschätzten Tage.
Wir verwenden diese Fehlerschätzungen, um die tagesspezifischen Schwangerschaftswahrscheinlichkeiten um den Fehler bei der Identifizierung des Eisprungs zu korrigieren. In beiden Studien tritt die maximale Schwangerschaftswahrscheinlichkeit bei Geschlechtsverkehr einen Tag vor dem geschätzten Tag des Eisprungs ein. Das bereinigte fruchtbare Intervall für beide Studien beginnt ~5 Tage vor dem Eisprung und endet am Tag des Eisprungs. Der Unterschied in den tagesspezifischen pk-Parametern zwischen den beiden Kohorten ist gering. Die mittlere Wahrscheinlichkeit der Lebensfähigkeit im Zyklus ist jedoch in der Kohorte von Wilcox et al. wesentlich geringer (0,35 im Vergleich zu 0,51).
Abbildung 2 zeigt die fehlerkorrigierten tagesspezifischen Schwangerschaftswahrscheinlichkeiten für die Kohorten von Barrett und Marshall und Wilcox et al. auf der Grundlage des oben beschriebenen parsimonischen gepoolten Modells. Die Wahrscheinlichkeit der Zyklusdurchführbarkeit ist für Paare in der Kohorte von Wilcox et al. signifikant niedriger (P < 0,01). Die Verteilung der Zykluswahrscheinlichkeiten der Paare in den einzelnen Studien ist in Abbildung 3 dargestellt. Es hat den Anschein, dass die Heterogenität zwischen den Paaren bei der Fruchtbarkeit in der Barrett- und Marshall-Kohorte größer ist als in der Wilcox et al.-Kohorte.
Diskussion
Wir haben Daten aus zwei prospektiven Studien zur menschlichen Fruchtbarkeit analysiert, um die Leistung von zwei Methoden zur Schätzung des Eisprungs zu vergleichen, das tagesspezifische Muster der Schwangerschaftswahrscheinlichkeiten zu beschreiben und die Schätzung des fruchtbaren Intervalls zu verbessern. Es zeigt sich, dass die DLT-Messung des Eisprungs weniger fehleranfällig ist als die BBT-basierte Messung. Der tatsächliche Fehler bei der Verwendung des BBT-Anstiegs könnte größer sein als wir schätzen: Barrett und Marshall haben eine unbekannte Anzahl von Zyklen verworfen, weil die Temperaturdiagramme als uninterpretierbar angesehen wurden. Es hat sich gezeigt, dass die BBT im Allgemeinen ovulatorische Zyklen als anovulatorisch identifiziert (Kesner et al., 1992), und es wurde festgestellt, dass die Varianz eines BBT-basierten Markers im Vergleich zu einem LH-basierten Marker im Urin größer war als die eines hormonellen Maßes, das auf dem Verhältnis von Östrogen und Progesteron basiert (Royston, 1991). Daher ist es nicht überraschend, dass die Messung des Eisprungs auf der Grundlage von Metaboliten im Urin zuverlässiger ist als die Messung auf der Grundlage der Basaltemperatur (Vermesh et al., 1987; Kesner et al., 1992).
Fehler bei der Messung des Eisprungs verzerren die Schätzungen der tagesspezifischen Schwangerschaftswahrscheinlichkeiten und verlängern die scheinbare Länge des fruchtbaren Intervalls. Unter Berücksichtigung von Messfehlern deutet unsere Analyse darauf hin, dass das fruchtbare Intervall ~5 Tage vor dem Eisprung beginnt und am Tag des Eisprungs endet (obwohl wir kleine Wahrscheinlichkeiten außerhalb dieser Grenzen nicht ausschließen können). Dieses 6-Tage-Intervall entspricht der unkorrigierten Schätzung aus der North-Carolina-Studie (Wilcox et al., 1998), ist aber viel kürzer als die neun Tage, die für die Daten von Barrett und Marshall angegeben wurden (Royston, 1982). Die beiden Studien stimmen sowohl in Bezug auf die Länge als auch auf die Lage des fruchtbaren Intervalls gut überein. Unsere Schätzung des fruchtbaren Intervalls stimmt mit dem Fehlen des empfängnisverhütenden Glycodelin A (GdA) im Uterus überein (Mandelin et al., 1997; Seppala et al., 1998), was darauf hindeutet, dass GdA eine grundlegende Rolle bei der Regulierung des fruchtbaren Intervalls spielen könnte.
Die geschätzte Wahrscheinlichkeit einer klinischen Schwangerschaft ist am Tag vor dem Eisprung am höchsten. Die Korrektur des Ovulationsmessfehlers in den Daten von Barrett und Marshall reduzierte die geschätzte Schwangerschaftswahrscheinlichkeit nach dem Tag der Ovulation auf nahezu Null, was mit dem Ergebnis übereinstimmt, das zuvor mit der (unkorrigierten) Analyse der Wilcox-Daten berichtet wurde (Wilcox et al., 1995, 1998). Dies deutet darauf hin, dass die Eizelle nach dem Eisprung eine sehr kurze Lebensfähigkeit hat und/oder dass die nach dem Eisprung im Fortpflanzungstrakt abgelagerten Spermien die Eizelle nicht erreichen können.
Das Ergebnis, dass der geschätzte Höhepunkt der Fruchtbarkeit am Tag vor dem Eisprung liegt, unterscheidet sich von den früher berichteten Ergebnissen (Wilcox et al., 1995), die den Höhepunkt der Fruchtbarkeit am Tag des Eisprungs zeigen. Die frühere Analyse umfasste sowohl frühe Verluste als auch klinische Schwangerschaften, während wir nur klinische Schwangerschaften verwenden. Wenn der Geschlechtsverkehr am Tag des Eisprungs stattfindet, kann die Eizelle zum Zeitpunkt der Befruchtung bereits gealtert sein. Dies wurde als Erklärung für die scheinbar hohe Wahrscheinlichkeit eines frühen Verlustes bei Empfängnissen, die aus dem Geschlechtsverkehr am Tag des Eisprungs resultieren, vorgeschlagen (Wilcox et al., 1998), eine Möglichkeit, die den Unterschied zwischen den berichteten Mustern erklären könnte.
Paare, die Schwierigkeiten haben, schwanger zu werden, versuchen oft, den Zeitpunkt ihres Geschlechtsverkehrs so zu wählen, dass sie ihre Chancen optimieren. Da die höchsten Empfängnisraten an den zwei Tagen vor dem Eisprung auftreten, ist es wichtig, ein Signal zu verwenden, das es den Paaren ermöglicht, den Geschlechtsverkehr auf die mehreren Tage der Fruchtbarkeit vor dem Eisprung zu legen. Die Verschiebung der Basaltemperatur kommt zu spät. Urin-LH-Kits ermitteln nur die kurze Zeit zwischen dem Beginn des LH-Anstiegs im Urin und dem Eisprung (Collins et al., 1983). Die Veränderung des Zervixschleims ist ein früherer und nützlicherer Hinweis. Die Empfänglichkeit des Schleims beginnt mehrere Tage vor dem Eisprung (Katz et al., 1997), so dass Paare, die nach diesem Hinweis häufig Geschlechtsverkehr haben, dazu neigen, an den Tagen mit der höchsten Wahrscheinlichkeit einer klinischen Schwangerschaft Geschlechtsverkehr zu haben.
Die tagesspezifischen Schätzungen der Fruchtbarkeit waren in den Wilcox-Daten deutlich niedriger als in den Daten von Barrett und Marshall. Hierfür gibt es mehrere mögliche Erklärungen. Möglicherweise spiegelt dies Unterschiede in den Spermien der Männchen in den beiden Populationen wider. Eine wahrscheinlichere Möglichkeit ist, dass die Auswahl der Zyklen für die Analyse die offensichtliche Fruchtbarkeit in den beiden Kohorten verzerrt hat. In beiden Studien wurden einige Zyklen von der Analyse ausgeschlossen. In der Studie von Barrett und Marshall wurde eine unbekannte (aber möglicherweise große) Anzahl von Temperaturdiagrammen verworfen, weil sie schwer zu interpretieren waren. Wenn diese verworfenen Zyklen eher aus Nicht-Schwangerschaftszyklen stammten (z. B. sind Zyklen mit unregelmäßigen Temperaturkurven tendenziell weniger fruchtbar), dann würde die geschätzte Fruchtbarkeit auf der Grundlage der nicht verworfenen Zyklen nach oben verzerrt werden. Nur ein kleiner Teil der verworfenen Zyklen aus der Studie von Wilcox et al. waren anovulatorische oder hormonell abnorme Zyklen. Die Mehrheit der ausgeschlossenen Zyklen wurde aufgrund von Tagen mit fehlenden Koitalaufzeichnungen verworfen (d. h. die Frau hat an einem relevanten Tag weder „ja“ noch „nein“ zum Geschlechtsverkehr angekreuzt). Die Daten von Barrett und Marshall sind in dieser Hinsicht sogar noch weniger aussagekräftig, da die Frauen nur die Tage ankreuzten, an denen sie Geschlechtsverkehr hatten, so dass es keine Möglichkeit gibt, „nein“ von fehlenden Daten zu unterscheiden. Die Möglichkeit, dass einige Geschlechtsverkehrshandlungen nicht aufgezeichnet wurden, ist eine weitere potenzielle Quelle für eine Verzerrung nach oben bei den Schätzungen der täglichen Wahrscheinlichkeiten auf der Grundlage der britischen Daten (Dunson und Weinberg, 1999b).
Es ist auch möglich, dass Paare in der Barrett- und Marshall-Kohorte, die während des fruchtbaren Intervalls Geschlechtsverkehr hatten, fruchtbarer waren als Paare, die nur außerhalb des Intervalls Geschlechtsverkehr hatten. Da die meisten Paare in der britischen Studie versuchten, eine Schwangerschaft zu vermeiden, waren die Paare, die während des fruchtbaren Intervalls Geschlechtsverkehr hatten, möglicherweise nicht in der Lage, sich lange genug zu enthalten. Wenn diese Paare mit hoher Libido fruchtbarer sind, würde diese Selbstselektion zu einem risikoreichen Verhalten zu einer Verzerrung der Schätzungen der täglichen Schwangerschaftswahrscheinlichkeiten führen, die auf Paaren beruhen, die versuchen, durch Enthaltsamkeit eine Empfängnis zu vermeiden.
Auch andere Faktoren im Zusammenhang mit der Fruchtbarkeit unterscheiden sich zwischen den beiden Studiengruppen. Die britischen Paare waren alle schon einmal schwanger gewesen, während etwa ein Drittel der Paare aus North Carolina zum ersten Mal eine Schwangerschaft versuchten und somit eine ungewisse Fruchtbarkeit aufwiesen. Die Paare aus North Carolina versuchten alle, schwanger zu werden, während die britischen Gruppen auch Paare umfassten, die ungewollt schwanger wurden, was bei den fruchtbareren Paaren wahrscheinlicher ist.
Zusammenfassend lässt sich sagen, dass die in dieser Arbeit angewandten Methoden verwendet werden können, um Verzerrungen bei der Schätzung des fruchtbaren Intervalls und der tagesspezifischen Schwangerschaftswahrscheinlichkeiten zu korrigieren, um die Fruchtbarkeit in verschiedenen Populationen zu vergleichen und um die Leistung der verfügbaren Ovulationsmessungen zu vergleichen. Wird der Fehler bei der Bestimmung des Tages des Eisprungs nicht berücksichtigt, so hängen die Schätzungen des fruchtbaren Intervalls und der tagesspezifischen Schwangerschaftswahrscheinlichkeiten von der Methode zur Bewertung des Eisprungs ab, d. h. unterschiedliche Methoden zur Schätzung des Eisprungs führen häufig zu unterschiedlichen Ergebnissen. In einer großen europäischen Studie, die derzeit durchgeführt wird, werden Daten sowohl zur Basaltemperatur als auch zu selbst eingeschätzten Veränderungen des Zervixschleims gesammelt. Unter Verwendung des letzten Tages der Unterkühlung auf der Grundlage von BBT-Messungen als Marker liegen die vorläufigen Schätzungen der tagesspezifischen Schwangerschaftswahrscheinlichkeiten für die laufende Studie bei bis zu 0,04 über den Zeitraum von 8 Tagen vor bis 2 Tagen nach der Schätzung des Eisprungs (Masarotto und Romualdi, 1997). Es ist wahrscheinlich, dass sich dieses scheinbare 11-Tage-Fenster drastisch verkleinern würde, wenn Messfehler berücksichtigt würden. Künftige Analysen, bei denen Fehler bei der Identifizierung des Eisprungs korrigiert werden, könnten die Fruchtbarkeitsraten der einzelnen Länder in diesem multinationalen Projekt vergleichen, alternative Methoden zur Erkennung des Eisprungs mit dem DLT und dem Anstieg der BBT vergleichen sowie die Fruchtbarkeitsparameter dieser neuen Kohorte mit denen der hier beschriebenen Kohorten vergleichen.
Anhang I. Berücksichtigung von Fehlern bei der Ovulation
Methoden
Nach dem Modell von Schwartz et al. (1980) beträgt die Schwangerschaftswahrscheinlichkeit für den Zyklus j unter der Bedingung einer Verschiebung um l Tage
Mit Einbeziehung von Fehlern, wie von Dunson und Weinberg (1999a) vorgeschlagen, beträgt die Wahrscheinlichkeit der beobachteten Daten:
wobei Yj 1 ist, wenn die Schwangerschaft im Zyklus j eingetreten ist, und ansonsten 0, und πl die Wahrscheinlichkeit ist, dass der identifizierte Tag des Eisprungs l Tage vor dem wahren Tag des Eisprungs liegt.
Wir machen mehrere vereinfachende Annahmen. Zunächst nehmen wir an, dass die tagesspezifischen Schwangerschaftswahrscheinlichkeiten außerhalb eines fruchtbaren Fensters 0 sind. Dann nehmen wir an, dass innerhalb des fruchtbaren Fensters die Wahrscheinlichkeiten bis zu einem Höchstwert ansteigen und dann abnehmen. Die Fehlerwahrscheinlichkeiten πl werden außerhalb eines Fensters ebenfalls als 0 angenommen. Damit die pk-Parameter als Wahrscheinlichkeiten in Bezug auf den wahren Tag des Eisprungs interpretiert werden können, muss angenommen werden, dass die wahrscheinlichste Differenz zwischen dem geschätzten Tag des Eisprungs und dem wahren Tag des Eisprungs bekannt ist. Dieser Unterschied kann hypothetisch anhand von Daten aus Validierungsstudien überprüft werden, die sowohl den Tag des Follikelaufbruchs als auch den mit dem Marker geschätzten Tag erfassen. Die geschätzten pk-Parameter und das fruchtbare Intervall sind auch dann gültig, wenn dieser Unterschied falsch spezifiziert ist. Allerdings werden die k-Subskripte systematisch verschoben. Die Korrelation innerhalb eines Paares wird durch ein Beta-Binomialmodell mit zufälligen Effekten berücksichtigt (Lee und Sabavala, 1987; Zhou et al., 1996).
Analyse
Der in Dunson und Weinberg (1999a) vorgeschlagene Markov-Chain-Monte-Carlo-Algorithmus (MCMC) kann direkt mit einem zusätzlichen Metropolis-Schritt zur Schätzung von β angewendet werden. Wir weisen β eine diffuse Prioritätsverteilung zu. Der Algorithmus wird 120 000 Mal iteriert und die ersten 10 000 Stichproben werden verworfen. Die Konvergenz wird mithilfe der Geweke-Diagnose (Geweke, 1992) überprüft.
Merkmale der Studienpopulationen.
Merkmal . | Barrett und Marshall . | Wilcox et al. (1988) . |
---|---|---|
*Gesamtzahl der Zyklen unbekannt. | ||
BBT = Basalkörpertemperatur; DLT = Tag des lutealen Übergangs. | ||
Ovulationsindikator | Anstieg der BBT | DLT |
Anzahl. der Frauen | 241 | 221 |
Anteil mit vorheriger Schwangerschaft | 100 | 64 |
Prozentualer Anteil >30 Jahre | 55 | 30 |
Anzahl der Zyklen insgesamt | * | 740 |
Anzahl der Zyklen in der Analyse | 2192 | 674 |
Anzahl. der klinischen Schwangerschaften | 103 | 151 |
Merkmal . | Barrett und Marshall . | Wilcox et al. (1988) . |
---|---|---|
*Gesamtzahl der Zyklen unbekannt. | ||
BBT = Basalkörpertemperatur; DLT = Tag des lutealen Übergangs. | ||
Ovulationsindikator | Anstieg der BBT | DLT |
Anzahl. der Frauen | 241 | 221 |
Anteil mit vorheriger Schwangerschaft | 100 | 64 |
Prozentualer Anteil >30 Jahre | 55 | 30 |
Anzahl der Zyklen insgesamt | * | 740 |
Anzahl der Zyklen in der Analyse | 2192 | 674 |
Anzahl. der klinischen Schwangerschaften | 103 | 151 |
Merkmale der Studienpopulationen.
Merkmal . | Barrett und Marshall . | Wilcox et al. (1988) . |
---|---|---|
*Gesamtzahl der Zyklen unbekannt. | ||
BBT = Basalkörpertemperatur; DLT = Tag des lutealen Übergangs. | ||
Ovulationsindikator | Anstieg der BBT | DLT |
Anzahl. der Frauen | 241 | 221 |
Anteil mit vorheriger Schwangerschaft | 100 | 64 |
Prozentualer Anteil >30 Jahre | 55 | 30 |
Anzahl der Zyklen insgesamt | * | 740 |
Anzahl der Zyklen in der Analyse | 2192 | 674 |
Anzahl. der klinischen Schwangerschaften | 103 | 151 |
Merkmal . | Barrett und Marshall . | Wilcox et al. (1988) . |
---|---|---|
*Gesamtzahl der Zyklen unbekannt. | ||
BBT = Basalkörpertemperatur; DLT = Tag des lutealen Übergangs. | ||
Ovulationsindikator | Anstieg der BBT | DLT |
Anzahl. der Frauen | 241 | 221 |
Anteil mit vorheriger Schwangerschaft | 100 | 64 |
Anteil >30 Jahre alt | 55 | 30 |
Anzahl der Zyklen insgesamt | * | 740 |
Anzahl der Zyklen in der Analyse | 2192 | 674 |
Anzahl. der klinischen Schwangerschaften | 103 | 151 |
Geschätzte Verteilung des Fehlers bei zwei Ovulationsmarkern. Die gestrichelte Linie stellt den Fehler am letzten Tag der Hypothermie dar, und die gepunktete Linie stellt den Fehler am Tag des lutealen Übergangs dar (wie anhand der Urinhormone geschätzt). BBT = Basaltemperatur; DLT = Tag des lutealen Übergangs.
Geschätzte Verteilung des Fehlers bei zwei Ovulationsmarkern. Die gestrichelte Linie stellt den Fehler am letzten Tag der Unterkühlung dar, die gepunktete Linie den Fehler am Tag des lutealen Übergangs (wie anhand der Urinhormone geschätzt). BBT = Basaltemperatur; DLT = Tag des Lutealübergangs.
Geschätzte Wahrscheinlichkeit, eine klinische Schwangerschaft zu erreichen, basierend auf einem einzigen Geschlechtsverkehr in jeder Studie. Die gestrichelte Linie stellt die Schätzungen der Barrett- und Marshall-Kohorte dar, die gepunkteten Linien die Schätzungen der Wilcox et al.-Kohorte.
Geschätzte Wahrscheinlichkeit, eine klinische Schwangerschaft zu erreichen, basierend auf einem einzigen Geschlechtsverkehr in jeder Studie. Die gestrichelte Linie stellt die Schätzungen aus der Barrett- und Marshall-Kohorte dar, die gepunkteten Linien die Schätzungen aus der Wilcox et al.-Kohorte.
Geschätzte Dichtefunktion der Zykluslebensfähigkeit für Paare in der Studie von Barrett und Marshall (gestrichelte Linie) und Paare in der Studie von Wilcox et al. (gepunktete Linie).
Geschätzte Dichtefunktion der Zykluslebensfähigkeit für Paare in der Studie von Barrett und Marshall (gestrichelte Linie) und Paare in der Studie von Wilcox et al. (gepunktete Linie).
An wen die Korrespondenz zu richten ist
Die Autoren danken Dr. Glinda Cooper und Dr. Haibo Zhou für das sorgfältige Lesen des Manuskripts.
Baird, D.D., Weinberg, C.R., Wilcox, A.J. et al. (
) Using the ratio of urinary oestrogen and progesterone metabolites to estimate day of ovulation.
,
,
-266.
Barrett, J. C. und Marshall, J. (
) The risk of conception on different days of the menstrual cycle.
,
,
-461.
Bongaarts, J. (1983) The proximate determinants of natural marital fertility. In Bulatao, R.A., Lee, R.D., Hollerbach, P.E. and Bongaarts, J. (eds), Determinants of Fertility in Developing Countries. Vol. 1. Academic Press, New York, USA, S. 103-138.
Collins, W.P., Branch, C.M., Collins, P.O. und Sallam, H.M. (
) Biochemical indices of the fertile period in women.
,
,
.
Dunson, D.B. und Weinberg, C.R. (1999a) Modeling human fertility in the presence of measurement error. Biometrics, in press.
Dunson, D.B. and Weinberg, C.R. (1999b) Accounting for unreported and missing intercourse in human fertility studies. Stat. Med., in press.
France, J.T., Graham, F.M., Gosling, L. et al. (
) Characteristics of natural conception cycles occurring in a prospective study of sex preselection: fertility awareness symptoms, hormone levels, sperm survival, and pregnancy outcome.
,
,
-255.
Geweke, J. (1992) Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments. In Bernardo, J.M., Berger, J.O., Dawid, A.P. und Smith, A.F.M. (eds), Bayesian Statistics. Vol. 4. Clarendon Press, Oxford, UK, pp. 169-193.
Katz, D.F., Slade, D.A., and Nakajima, S.T. (
) Analysis of pre-ovulatory changes in cervical mucus hydration and sperm penetrability.
,
,
-151.
Kesner, J.S., Wright, D.M., Schrader, S.M. et al. (
) Methods of monitoring menstrual function in field studies: efficacy of methods.
,
,
-400.
Mandelin, E., Koistinen, H., Koistinen, R. et al. (
) Levonorgestrel-freisetzende Intrauterinpessar-Trägerinnen exprimieren das kontrazeptive Glycodelin A im Endometrium während der Zyklusmitte: ein weiterer kontrazeptiver Mechanismus?
,
,
-2675.
Masarotto, G. und Romualdi, C. (
) Probability of conception on different days of the menstrual cycle: an ongoing exercise.
,
,
-115.
Perloff, W.H. und Steinberger, E. (
) In vivo survival of spermatozoa in cervical mucus.
,
,
-442.
Royston, J.P. (
) Basal body temperature, ovulation, and the risk of conception, with special reference to the lifetimes of sperm and egg.
,
,
-406.
Royston, P. (
) Identifying the fertile phase of the human menstrual cycle.
,
,
-240.
Schwartz, D., MacDonald, P.D.M. und Heuchel, V. (
) Fecundability, coital frequency, and the viability of ova.
,
,
-461.
Seppala, M., Koistinen, H., Mandelin, E. et al. (
) Glycodelins: role in regulation, potential for contraceptive development and diagnosis of male infertility.
,
,
-269.
Vermesh, M., Kletzky, O.A., Davajan, V., Israel, R. (
) Monitoring techniques to predict and detect ovulation.
,
,
-264.
Wilcox, A.J., Weinberg, C.R., O’Connor, J.F. et al. (
) Incidence of early loss of pregnancy.
,
,
-194.
Wilcox, A.J., Weinberg, C.R., and Baird, D.D. (
) Timing of sexual intercourse in relation to ovulation.
,
,
-1521.
Wilcox, A. J., Weinberg, C. R., und Baird, D. D. (
) Post-ovulatorische Alterung der menschlichen Eizelle und Embryonenversagen.
,
,
-397.
Zhou, H., Weinberg, C.R., Wilcox, A.J., and Baird, D.D. (
) A random-effects model for cycle viability in fertility studies.
,
,
-1422.
Schreibe einen Kommentar