Loading…
Thumbnail Image

Multiple Merger Coalescents and Population Genetic Inference

Steinrücken, Matthias

Inst. Mathematik

Mathematische Populationsgenetik beschäftigt sich mit der Konstruktion von Modellen um biologisch interessante Phänomene zu beschreiben und zu analysieren. Der klassische Fleming-Viot Prozess beschreibt die Evolution einer Population in vorwärtsgerichteter Zeit. Er ist dual zu Kingman's Koaleszenten, welcher die Genealogie einer Stichprobe von Individuen, also die Rückwärtsdynamik beschreibt. Pitman (1999) und Sagitov (1999) haben eine allgemeinere Klasse von Koaleszenten eingeführt, die im Gegensatz zu Kingman's Koaleszent das Verschmelzen von mehr als zwei Ahnenlinien auf einmal erlaubt. Diese Lambda-Koaleszenten sind dual zu den Lambda-Fleming-Viot Prozessen. Donnelly und Kurtz (1996 & 1999) führten die sogenannte Lookdown-Konstruktion ein um zu zeigen, das diese Dualitäten auch in einem pfadweisen Sinne gelten. In der vorliegenden Arbeit erweitern wir diese Lookdown-Konstruktion um damit den Xi-Fleming-Viot Prozess zu konstruieren und seine pfadweise Dualität zum Xi-Koaleszenten zu etablieren. Der Xi-Koaleszent zeichnet sich dadurch aus, dass er das simultane Verschmelzen von mehren Ahnenlinen erlaubt. Der zweite Teil der Arbeit beschäftgt sich mit der statistischen Inferenz von evolutionären Parametern unter dem Lambda-Koaleszenten und dem sogenannten infinitely-many-sites Mutationsmodel. Wir präsentieren Rekursionformeln mit denen sich die Wahrscheinlichkeit eine gegebene Stichprobe von der Population zu ziehen berechnen lässt (eingeführt von Birkner und Blath (2008)). Mit Hilfe dieser Rekursion lässt sich ein Monte-Carlo-Simulations-Verfahren beschreiben, das zur Schätzung der Wahrscheinlichkeit für große Stichproben benutzt werden kann. Aufbauend auf der Arbeit von Stephens und Donnelly (2000) und Hobolth et. al. (2008) interpretieren wir diese Methode als ein "importance sampling"-Schema und führen weitere Schemata ein, um die Genauigkeit der Schätzungen zu erhöhen. Wir wenden diese Verfahren an, um evolutionäre Parameter für reale Datensätze mitochondrialer DNA vom atlantischen Kabeljau zu bestimmen. Wir argumentieren, dass die Lambda-Koaleszenten besser geeignet sind die Genealogien der Datensätze zu beschreiben als der klassische Kingman-Koaleszent.
A fundamental goal in mathematical population genetics is the construction of population models to describe and analyse certain phenomena which are of interest for biological applications. The classical Fleming-Viot process describes the evolution of a population forward in time. It is dual to Kingman's coalescent, which describes the genealogy of a sample of individuals backwards in time. Pitman (1999) and Sagitov (1999) introduced a more general class of coalescent processes, allowing for multiple coalescence of ancestral lines, whereas only binary merging is possible in Kingman's coalescent. These Lambda-coalescents are dual to the so-called Lambda-Fleming-Viot processes. Donnelly and Kurtz (1996 & 1999) introduced the lookdown construction to show that these dualities also hold in a pathwise sense. In this work we extend the lookdown construction to the Xi-Fleming-Viot process and establish its pathwise duality to the Xi-coalescent, a coalescent process which allows for simultaneous multiple merging of ancestral lines. The second part of this work deals with statistical inference of evolutionary parameters under the Lambda-coalescent and the infinitely-many-sites mutation model. We present recursive formulae that can be used to compute the probability to obtain a certain sample from the population at stationarity (these recursions where introduced by Birkner and Blath (2008)). Based on these recursions we can derive a Monte-Carlo-method that can be used to estimate the sampling probability for large sample sizes. Extending the work of Stephens and Donnelly (2000) and Hobolth et. al. (2008) we interpret this method as an importance sampling scheme and develop additional schemes to improve the performance of the method. We apply our developed methods to infer evolutionary parameters for mitochondrial datasets taken from Atlantic Cod. We argue that the Lambda-coalescents are more suitable to describe the genealogies underlying the data then Kingman's coalescent.