La aproximación de Kimura para la probabilidad de fijación de una mutación bajo selección encuentra un uso recurrente en los modelos de genética de poblaciones hasta la fecha. Estoy tratando de entender la base matemática de esta ecuación, pero ninguno de los libros de texto o recursos en línea que he revisado proporcionan una derivación fácil de esta aproximación, sino que simplemente citan el artículo de Kimura de 1962 .
Entonces, estaba leyendo el artículo original, pero la derivación provista no me parece clara.
Kimura comienza con la definición de probabilidad de cambio en la frecuencia alélica como:
donde (citado exactamente)
Luego usa la aproximación de la serie de Taylor para obtener una ecuación de esta forma:
el define y como media y varianza del cambio de por generación. Estos se definen formalmente como:
( en realidad debería ser solo el segundo momento según la definición matemática y no la varianza)
Luego resuelve la ecuación 3 en estado estacionario con condiciones de contorno y para obtener esto:
donde:
Entendí la derivación hasta este punto.
Luego solo pone:
y obtiene la ecuación 1.
¿Existe una derivación fácil para la ecuación 1?
Si no, ¿alguien puede explicarme cómo se aproximaron M y V como se indicó anteriormente?
Presumiblemente, ha resuelto esto, pero, en caso de que no, es porque la PDE es una ecuación inversa de Kolmogorov , por lo que los coeficientes de primer y segundo orden son la media y la varianza del proceso estocástico subyacente que se está modelando.
En detalle, considere una ecuación diferencial estocástica (que tiene una solución dada por un proceso de difusión de Ito):
Tenga en cuenta que la deriva (media infinitesimal) y coeficiente de difusión (varianza infinitesimal) son como en el documento (excepto por el signo negativo, que supongo que es ignorable ya que en su mayoría parece preocuparse solo por el caso cuando de todos modos). De hecho, se escriben de manera equivalente:
Tenga en cuenta que una aproximación útil de la densidad de transición viene dada por:
Ok, entonces todo lo anterior es solo teoría básica de procesos estocásticos. Por lo tanto, si tenemos un modelo estocástico para la dinámica de la población, podemos derivar valores para y a partir de él (calculando sus momentos), y esos se trasladarán a la ecuación inversa de Kolmogorov, sobre la cual se basa el trabajo de Kimura.
Aquí es donde se muestra mi ignorancia sobre la dinámica de la población. Sin embargo, dado que Kimura menciona a Fisher y Wright, busqué el modelo de Wright-Fisher. Parece que Kimura está utilizando la aproximación del proceso de difusión del modelo de Wright-Fisher. Este parece ser un modelo bien estudiado y con historia que no puedo describir completamente aquí; en cambio, encontré que el trabajo de Tataru et al, Statistical Inference in the Wright-Fisher Model Using Allele Frequency Data es una excelente descripción del mismo, aunque no pretendo entender mucho de él.
Sin embargo, lo importante es que el cambio en los genes (densidad de transición) puede describirse mediante una distribución binomial. Esto se puede aproximar mediante una distribución normal:
(Noté que otra forma de probar esto es notar que la difusión aproximada de Wright-Fisher (sin ninguna selección, etc.... así que ) tiene un generador infinitesimal dado por: . Esto implica inmediatamente . Pero puede ser menos sencillo de entender. )
Sin embargo, de manera confusa, el documento ha cambiado las escalas de tiempo (variables), de modo que , y luego establecer a (probablemente para que no tuvieran que escribir En todas partes). Si deshacemos esta transformación, obtenemos
Ahora bien, ¿cuál es la media infinitesimal, es decir, o ? Claramente esto depende del modelo de selección, ya que controla cómo el "entorno" afecta de manera determinista al proceso. Kimura describe esto como una "ventaja de selección constante" con coeficiente . El artículo de Tataru señala que la aproximación de difusión a Wright-Fisher bajo deriva genética, mutación y selección está dada por:
Por lo tanto, hemos derivado donde Kimura's y provienen, aunque probablemente no de la manera más simple posible.
Todo lo que queda es derivar la ecuación (de estado estacionario) para . Supongo que lo haré para completar.
Ignorando los subíndices de estado estacionario, obtenemos:
Disculpas por cualquier error. (No soy un modelador de dinámica de población ni un matemático, así que por favor señale cualquier problema).
Nicolás
WYSIWYG