He aquí una cita de Wagner (2008)
Una segunda línea de evidencia [contra el neutralismo] proviene de la relación entre el número medio de diferencias polimórficas entre alelos dentro de una especie, , y el número de diferencias fijas entre genes en dos especies, . Para mutaciones neutras, una asociación positiva entre y debería existir, porque la teoría neutral predice que ambas cantidades son linealmente proporcionales a la velocidad a la que surgen las mutaciones neutrales. Los datos recientes a escala del genoma muestran, en cambio, que esta asociación es, de hecho, negativa.
¿Qué tienen que ver entre sí "el número medio de diferencias polimórficas entre alelos dentro de una especie" y "el número de diferencias fijas entre genes en dos especies"? ¿Por qué debería haber alguna relación en absoluto? Y por "dos especies", ¿están hablando de pinzones chillones de espalda amarilla del este frente a pinzones chillones de espalda amarilla del oeste, o dos especies arbitrarias, como E. coli frente a ratas almizcleras?
Encontré esta pregunta relacionada , pero no dice nada sobre diferentes especies.
Las dos métricas que le interesan son
Considere dos secuencias
Hay 2 diferencias por pares entre estas dos secuencias (posiciones 3 y 6).
El punto aquí es entender que dos individuos en la misma población se unen en un momento dado en el pasado como dos individuos que provienen de dos especies diferentes. El número de diferencias por pares es igual a la velocidad a la que se acumulan las mutaciones multiplicada por el tiempo de coalescencia. Permítanme desarrollar esta idea con algunas ecuaciones a continuación.
¡Hagamos cuentas! Haremos dos suposiciones importantes a continuación.
Introducción a la teoría de la coalescencia
Primero asegurémonos de que comprende el concepto de coalescencia. Imagina que fueras a mirar una población en evolución hacia atrás en el tiempo. Un evento coalescente es un evento por el cual dos linajes se vuelven uno (mirando hacia atrás en el tiempo). Para simplificar, considere el caso de una población asexual (pero los cálculos futuros no hacen esta suposición). En una población asexual, dos hermanos fusionaron la generación anterior, ya que en la generación anterior los genes que portan estaban en un solo individuo (su progenitor).
Veremos a continuación cómo calcular el tiempo de coalescencia entre dos individuos seleccionados al azar de una población y cómo podemos hacer inferencias sobre la diversidad genética a partir de este tiempo de coalescencia.
Tasa de acumulación de mutaciones neutras
La tasa de acumulación de mutación neutra también se denomina tasa de fijación de mutaciones neutras. Dejar sea esta tasa de fijación. Considere una población diploide panmíctica de tamaño constante . En un locus de interés dado, la tasa de mutación es . El número de mutaciones que ocurren cada generación en esta población es (El proviene del hecho de que en una población diploide hay dos copias homólogas de cada gen en cada célula). Si la mutación es neutra, entonces cada individuo de la población tiene la misma probabilidad de terminar siendo el progenitor de toda la población en un largo tiempo en el futuro. En otras palabras, comenzando a mirar este problema desde el futuro y mirando hacia atrás en el tiempo, cualquier individuo en una distancia lo suficientemente lejana en el futuro desciende de un solo individuo en el presente. En consecuencia, la probabilidad de que una nueva mutación alcance la fijación es . Multiplicando la probabilidad de fijación por la tasa a la que ocurren las mutaciones en toda la población, obtenemos . En otras palabras, la tasa de fijación de nuevas mutaciones neutrales es simplemente igual a la tasa a la que se produce la mutación.
Ecuación clave:
- número de diferencias por pares entre alelos muestreados aleatoriamente (con reemplazo) provenientes de diferentes especies
Considere dos especies cuyo ancestro común vivió hace generaciones. Cada linaje acumuló mutaciones a un ritmo (y explicado anteriormente) y, por lo tanto, el número total esperado (promedio) de diferencias por pares es . La probabilidad de tener exactamente las diferencias por pares provienen de una distribución de Poisson con tasa ( ).
Ecuación clave:
- número de diferencias por pares entre alelos muestreados aleatoriamente (con reemplazo) provenientes de la misma población
Aquí los cálculos siguen la misma lógica que arriba . Todo el asunto es que (el tiempo de coalescencia) es desconocido por el momento y necesitamos calcularlo.
Dejar Sea la probabilidad de que dos individuos muestreados aleatoriamente (con reemplazo) de una población panmíctica diploide se unan exactamente hace generaciones. La probabilidad de unirse en una generación dada es simplemente la probabilidad de atraer al mismo individuo, es decir y la probabilidad de no fusionarse en ninguna generación posterior es . Iterando sobre las generaciones obtenemos
, dónde es el número de Euler. La aproximación anterior es precisa para grandes (digamos más grande que 100). En caso de que esté interesado, encontrará en esta publicación de Math.SE una explicación para esta aproximación.
El valor esperado (promedio) de esta distribución es (y la varianza es ). Como consecuencia, el número esperado de diferencias por pares entre estos dos individuos es
Hablando rápidamente, estos cálculos se pueden extender para calcular el tiempo de coalescencia entre alelos muestreados aleatoriamente. El tiempo de coalescencia esperado es entonces y por lo tanto algo de álgebra muestra que el tiempo total esperado (a lo largo de todas las ramas) es y el número esperado de sitios de segregación es .
Ecuación clave:
Es claro de lo anterior que y están correlacionados ya que ambos están relacionados linealmente con la tasa de mutación. Como dice en tu cita
Para mutaciones neutras, una asociación positiva entre y debería existir, porque la teoría neutral predice que ambas cantidades son linealmente proporcionales a la velocidad a la que surgen las mutaciones neutrales
La cita va diciendo
Los datos recientes a escala del genoma muestran, en cambio, que esta asociación es, de hecho, negativa.
Esta relación negativa entre y no puede ser causada por procesos neutrales. Por lo tanto, la selección debe estar involucrada de alguna manera.
Imagine, por ejemplo, que dos especies se seleccionan en diferentes niveles óptimos (presiones de selección opuestas). En tal caso, vería una selección purificadora dentro de las especies reduciendo la probabilidad de que una nueva mutación alcance la fijación a un valor inferior a y por lo tanto reduciendo la tasa de fijación de modo que . Sin embargo, tal presión de selección opuesta entre especies hará que las especies diverjan más de lo esperado por procesos aleatorios que es . Tal patrón selectivo podría explicar la relación negativa observada.
Esta publicación ofrece recomendaciones de libros sobre el tema (genética de poblaciones).
Remi.b
alex