Estoy leyendo del libro de texto clásico Principios de genética de poblaciones, Hartl y Clark (pdf aquí ).
Introducción
Dejar denota la distribución de la frecuencia alélica en el momento sabiendo que en ese momento la frecuencia era . Se puede modelar el cambio en esta distribución con el tiempo usando la ecuación directa de Kolmogorov
donde es el "parámetro de deriva", que representa la selección natural (por lo tanto, en ausencia de la selección ), y es el "parámetro de difusión", que representa la deriva genética. El parámetro de difusión es , donde es el tamaño de la población.
Pregunta
¿Por qué es cierto que ?
Doy la bienvenida a explicaciones intuitivas y pruebas matemáticas.
Pensamientos
Creo que se deriva del modelo de deriva genética de Wright-Fisher, donde la distribución de la frecuencia de alelos en la próxima generación viene dada por una distribución binomial.
Efectivamente, procede del modelo de Wright-Fisher, concretamente de su aproximación al proceso de difusión.
Si la población es de tamaño , entonces en la generación el numero de alelos es , por lo que la frecuencia de los alelos es , asumiendo el caso diploide. Entonces Wright-Fisher dice que:
Podemos relacionar esto con el delantero Kolmogorov de la siguiente manera. Recuerde que la distribución binomial se puede aproximar mediante una distribución normal , con media y varianza dada por la media y la varianza de la binomial. Esto nos dice que:
En términos de intuición, no estoy muy seguro. Esencialmente mide cuánta perturbación en la frecuencia alélica se puede esperar que suceda en cada generación debido a efectos puramente aleatorios, es decir, deriva genética. Observe que no hay perturbación cuando o , es decir, no pueden ocurrir cambios aleatorios si nadie o todos tienen el alelo. Observe también que esta varianza es exactamente la varianza de una distribución de Bernoulli . Es como si hubiéramos destilado el modelo de nivel individual a un modelo de nivel de población que simplemente observa la frecuencia de la elección binaria de la presencia de alelos, supongo. La varianza (ruido) es máxima cuando la frecuencia es . Es una especie de alejar el alelo del medio, aumentando el ruido cuando uno va allí; uno podría esperar que (si se ejecuta el tiempo suficiente) cualquier modelo de este tipo golpeará y se atascará en o (No estoy seguro si esto es cierto). Busqué un poco si había otras interpretaciones interesantes del sde consideradas aquí (por ejemplo, en física), pero no pude encontrar ninguna. Básicamente, sería equivalente a una ecuación de calor, extendiéndose bajo alguna función potencial controlada por .
Tu pregunta está estrechamente relacionada con esta . Mi respuesta sigue en gran medida a Tataru et al, Inferencia estadística en el modelo de Wright-Fisher utilizando datos de frecuencia de alelos .
diez
V(x)
?Remi.b