Relación entre diversidad genética dentro y entre especies

He aquí una cita de Wagner (2008)

Una segunda línea de evidencia [contra el neutralismo] proviene de la relación entre el número medio de diferencias polimórficas entre alelos dentro de una especie, π , y el número de diferencias fijas entre genes en dos especies, d . Para mutaciones neutras, una asociación positiva entre π y d debería existir, porque la teoría neutral predice que ambas cantidades son linealmente proporcionales a la velocidad a la que surgen las mutaciones neutrales. Los datos recientes a escala del genoma muestran, en cambio, que esta asociación es, de hecho, negativa.

¿Qué tienen que ver entre sí "el número medio de diferencias polimórficas entre alelos dentro de una especie" y "el número de diferencias fijas entre genes en dos especies"? ¿Por qué debería haber alguna relación en absoluto? Y por "dos especies", ¿están hablando de pinzones chillones de espalda amarilla del este frente a pinzones chillones de espalda amarilla del oeste, o dos especies arbitrarias, como E. coli frente a ratas almizcleras?

Encontré esta pregunta relacionada , pero no dice nada sobre diferentes especies.

Buena pregunta +1. Edité tu publicación para deshacerme de lo que pensé que era información innecesaria. Siéntase libre de retroceder si no le gusta la edición.
Suponiendo que todos los demás aquí tengan los antecedentes necesarios, está bien. No soy biólogo, por lo que las teorías del neutralismo/seleccionismo eran nuevas para mí.

Respuestas (1)

Métricas de interés

Las dos métricas que le interesan son

  • π - el número medio de diferencias entre dos alelos muestreados aleatoriamente (con reemplazo) en una población
  • d - el número medio de diferencias entre dos alelos muestreados aleatoriamente (con reemplazo) provenientes de dos especies diferentes

Considere dos secuencias

  • ATCGTCAAT
  • ATAGTTAAT

Hay 2 diferencias por pares entre estas dos secuencias (posiciones 3 y 6).

El punto aquí es entender que dos individuos en la misma población se unen en un momento dado en el pasado como dos individuos que provienen de dos especies diferentes. El número de diferencias por pares es igual a la velocidad a la que se acumulan las mutaciones multiplicada por el tiempo de coalescencia. Permítanme desarrollar esta idea con algunas ecuaciones a continuación.

Expectativas neutrales

¡Hagamos cuentas! Haremos dos suposiciones importantes a continuación.

  1. Cada mutación crea un nuevo alelo (es un modelo de alelo infinito)
  2. Todas las mutaciones son sustituciones (sin indeles, sin duplicación de genes, etc.)

Introducción a la teoría de la coalescencia

Primero asegurémonos de que comprende el concepto de coalescencia. Imagina que fueras a mirar una población en evolución hacia atrás en el tiempo. Un evento coalescente es un evento por el cual dos linajes se vuelven uno (mirando hacia atrás en el tiempo). Para simplificar, considere el caso de una población asexual (pero los cálculos futuros no hacen esta suposición). En una población asexual, dos hermanos fusionaron la generación anterior, ya que en la generación anterior los genes que portan estaban en un solo individuo (su progenitor).

Veremos a continuación cómo calcular el tiempo de coalescencia entre dos individuos seleccionados al azar de una población y cómo podemos hacer inferencias sobre la diversidad genética a partir de este tiempo de coalescencia.

Tasa de acumulación de mutaciones neutras

La tasa de acumulación de mutación neutra también se denomina tasa de fijación de mutaciones neutras. Dejar F i X sea ​​esta tasa de fijación. Considere una población diploide panmíctica de tamaño constante norte . En un locus de interés dado, la tasa de mutación es m . El número de mutaciones que ocurren cada generación en esta población es 2 norte m (El 2 proviene del hecho de que en una población diploide hay dos copias homólogas de cada gen en cada célula). Si la mutación es neutra, entonces cada individuo de la población tiene la misma probabilidad de terminar siendo el progenitor de toda la población en un largo tiempo en el futuro. En otras palabras, comenzando a mirar este problema desde el futuro y mirando hacia atrás en el tiempo, cualquier individuo en una distancia lo suficientemente lejana en el futuro desciende de un solo individuo en el presente. En consecuencia, la probabilidad de que una nueva mutación alcance la fijación es 1 2 norte . Multiplicando la probabilidad de fijación por la tasa a la que ocurren las mutaciones en toda la población, obtenemos 1 2 norte 2 norte m = m . En otras palabras, la tasa de fijación de nuevas mutaciones neutrales es simplemente igual a la tasa a la que se produce la mutación.

Ecuación clave:

F i X = 1 2 norte 2 norte m = m

d - número de diferencias por pares entre alelos muestreados aleatoriamente (con reemplazo) provenientes de diferentes especies

Considere dos especies cuyo ancestro común vivió T hace generaciones. Cada linaje acumuló mutaciones a un ritmo m (y explicado anteriormente) y, por lo tanto, el número total esperado (promedio) de diferencias por pares es d ¯ = 2 m T . La probabilidad de tener exactamente d las diferencias por pares provienen de una distribución de Poisson con tasa 2 m T ( PAG ( D = d ) = PAG o i s s o norte ( 2 m T ) ).

Ecuación clave:

d ¯ = 2 m T

π - número de diferencias por pares entre alelos muestreados aleatoriamente (con reemplazo) provenientes de la misma población

Aquí los cálculos siguen la misma lógica que arriba π = 2 m T . Todo el asunto es que T (el tiempo de coalescencia) es desconocido por el momento y necesitamos calcularlo.

Dejar PAG ( T ) Sea la probabilidad de que dos individuos muestreados aleatoriamente (con reemplazo) de una población panmíctica diploide se unan exactamente T hace generaciones. La probabilidad de unirse en una generación dada es simplemente la probabilidad de atraer al mismo individuo, es decir 1 2 norte y la probabilidad de no fusionarse en ninguna generación posterior es 1 1 2 norte . Iterando sobre las generaciones obtenemos

PAG ( T ) = 1 2 norte ( 1 1 2 norte ) T 1 2 norte mi T 2 norte

, dónde mi 2.7 es el número de Euler. La aproximación anterior es precisa para grandes norte (digamos más grande que 100). En caso de que esté interesado, encontrará en esta publicación de Math.SE una explicación para esta aproximación.

El valor esperado (promedio) T ¯ de esta distribución es T ¯ = 2 norte (y la varianza es v a r ( T ) = 4 norte 2 ). Como consecuencia, el número esperado de diferencias por pares entre estos dos individuos es π = 2 m 2 norte = 4 norte m

Hablando rápidamente, estos cálculos se pueden extender para calcular el tiempo de coalescencia entre k alelos muestreados aleatoriamente. El tiempo de coalescencia esperado es entonces T ¯ = 4 norte k ( k 1 ) y por lo tanto algo de álgebra muestra que el tiempo total esperado (a lo largo de todas las ramas) es 4 norte i = 1 k 1 1 i y el número esperado de sitios de segregación es 4 norte m i = 1 k 1 1 i .

Ecuación clave:

π = 4 norte m

Conclusión

Es claro de lo anterior que π = 4 norte m y d = 2 m T están correlacionados ya que ambos están relacionados linealmente con la tasa de mutación. Como dice en tu cita

Para mutaciones neutras, una asociación positiva entre π y d debería existir, porque la teoría neutral predice que ambas cantidades son linealmente proporcionales a la velocidad a la que surgen las mutaciones neutrales

La cita va diciendo

Los datos recientes a escala del genoma muestran, en cambio, que esta asociación es, de hecho, negativa.

Esta relación negativa entre d y π no puede ser causada por procesos neutrales. Por lo tanto, la selección debe estar involucrada de alguna manera.

Imagine, por ejemplo, que dos especies se seleccionan en diferentes niveles óptimos (presiones de selección opuestas). En tal caso, vería una selección purificadora dentro de las especies reduciendo la probabilidad de que una nueva mutación alcance la fijación a un valor inferior a 1 2 norte y por lo tanto reduciendo la tasa de fijación F i X de modo que F i X < m . Sin embargo, tal presión de selección opuesta entre especies hará que las especies diverjan más de lo esperado por procesos aleatorios que es π > 4 norte m . Tal patrón selectivo podría explicar la relación negativa observada.

Más información

Esta publicación ofrece recomendaciones de libros sobre el tema (genética de poblaciones).

cuando dices "número medio de diferencias", ¿cómo se cuantifica esto? ¿Número de pares de bases diferentes?
Sí exactamente. Hay dos suposiciones (me olvidé en mi respuesta pero las agregaré) 1. Todas las mutaciones son sustituciones (sin indel, sin duplicación de cromosomas completos, etc.) y 2. cada mutación crea un nuevo alelo (modelo de alelo infinito)
¿Son esos supuestos específicos de la teoría neutral? Supongo que se supone que esto es una prueba por contradicción, así que quiero ver qué premisas específicas nos llevan a la contradicción.
Esas son suposiciones muy comunes que se encuentran en la literatura de la teoría neutral y, más globalmente, en la literatura sobre la deriva genética. El concepto de prueba por contradicción se aplica a las matemáticas pero no a las ciencias empíricas (¿o no?). Solo tenemos una predicción nula (modelo sin selección) y si los datos no coinciden, entonces algo más debe estar sucediendo. (Gracias por la edición)