¿Cómo formulamos la carga mutacional del "ADN basura"?

Question

¿Cómo formulamos la carga mutacional del "ADN basura"?

Biología
evolución-molecular
genética de poblaciones
biología-teórica

Maximiliano Prensa

Preguntas)

Basado en el libro de texto de Joe Felsenstein, estaba tratando de formular la carga mutacional para la mayoría de los genomas eucariotas que son ADN basura ( $L_{most\_of\_genome}$ ). (Consulte la sección de antecedentes para obtener más detalles y citas relevantes).

Extrapolando lo que Joe escribe sobre loci no basura y eliminando una suposición simplificadora (Muller-Haldane), creo que esto debería ser igual a la frecuencia alélica de cada locus (simplificando aquí al promedio de estos loci, $q_e$ ) multiplicado por cualquier coeficiente de selección infinitesimal que tenga cada locus ( $s$ , en promedio), sumados en todos los loci ( $N_{positions}$ ):

$L_{most\_of\_genome} = N_{positions}q_{e}s$

(Idealmente, sumaríamos esto a través de estimaciones individuales de $q_e$ y $s$ para cada lugar geométrico, pero eso obviamente no es práctico aquí, así que usamos la media entre los lugares geométricos).

Aquí hay algunas preguntas estrechamente relacionadas:

1) ¿Es lo anterior una formulación razonable para $L_{most\_of\_genome}$ ? Si no, ¿cuál sería? (Puedo imaginar fácilmente que muchas suposiciones comienzan a romperse con cientos de millones de posiciones, etc.)

2) Si es una formulación razonable, ¿cuáles son los rangos de parámetros "razonables" para $s$ y $q_{e}$ de mutantes casi neutrales "perjudiciales" para esta mayoría del genoma? (Por ejemplo, podríamos decir que $s$ puede tomar valores menores que el inverso del tamaño de la población.)

Tenga en cuenta que estoy hablando de ADN basura, no de ADN no codificante. Sabemos bastante sobre la carga mutacional del ADN no codificante (no basura) .

Posibles problemas con este

Introduzcamos algunos valores aquí, digamos a través de mil millones de loci con coeficientes de selección muy pequeños de $10^{-10}$ y $q_e$ igual a la tasa de mutación $u$ de $10^{-8}$ (por ejemplo, todas las variantes perjudiciales son mutaciones nuevas), puedo escribir:

$L_{most\_of\_genome} = N_{positions}q_{e}s = (10^9)(10^{-8})(10^{-10}) = 10^{-9}$

Este es un subconjunto de la carga mutacional general. Para estos valores de parámetros, eso parece plausible, pero si tomamos en serio el argumento de Joe (ver más abajo) de que muchos de estos loci corregirán variantes perjudiciales, por ejemplo $q_e \approxeq 1.0$ , entonces este valor podría llegar a ser bastante alto.

Por ejemplo, aquí hay un cálculo diferente asumiendo que $q_e \approxeq 0.1$ :

$L_{most\_of\_genome} = N_{positions}q_{e}s = (10^9)(10^{-1})(10^{-10}) = 0.01$

¡Esa es una carga no trivial!

De hecho, asintóticamente esperamos que cada locus corrija variantes ligeramente perjudiciales. En este caso de variantes ligeramente perjudiciales universalmente fijadas, esta carga está más cerca de $10^{-1}$ para el ejemplo anterior. Para las coníferas y los ajolotes con genomas de >10 Gbp, esperaríamos que la carga solo del ADN basura fuera mayor que 1 para estos valores de parámetros, por ejemplo, muertos. Joe tiene una sección "¿Por qué no estamos todos muertos?" pero no aborda esto directamente, y utiliza principalmente argumentos verbales.

Fondo

Estoy refrescando mi conocimiento de la carga mutacional leyendo la sección del libro de Joe Felsenstein sobre el tema (págs. 152-158), y ahora estoy recordando algo con lo que luché mientras tomaba la clase que él impartía sobre el tema.

Joe escribe en la sección "Selección débil y carga mutacional":

Como se dice que la carga mutacional es una función de la tasa de mutación, pero no del coeficiente de selección, es natural preguntarse cómo una selección muy débil podría imponer una carga. Seguramente el principio de Haldane-Muller no puede sostenerse hasta $s = 0$ . Por supuesto, no lo hace. En el caso haploide, la frecuencia del gen del equilibrio mutacional $q_{e} = \frac{u}{s}$ solo es correcto si $u < s$ , de lo contrario el único equilibrio del sistema (III-21) es $q_{e} = 1$ . Si $u \geq s$ , de modo que $q_{e} = 1$ , la carga es $L = q_{e}s = s$ , de modo que cuando consideramos casos con valores progresivamente más pequeños de $s$ , la carga permanecerá $u$ hasta $s = u$ , luego, por debajo de ese punto, la carga disminuirá suavemente hasta cero a medida que s disminuya.

(Dónde $s$ es el coeficiente de selección para un alelo mutante, $q_{e}$ es la frecuencia del alelo mutante, y $u$ es la tasa de mutación en ese locus.)

Joe luego habla de otras cosas y concluye:

La carga será una función simple de $u$ a menos que $s$ es tan pequeño que no es sustancialmente mayor que $u$ . Por debajo de ese punto, la carga se reducirá a cero a medida que $s$ hace _

Esta última oración (mi énfasis) no es obvia para mí según lo que he leído.

Tengo problemas para seguir esta lógica. Esto es lo que entiendo al respecto:

1) Muller-Haldane afirma que $s$ tiene muy poco impacto en $L$ , tal que con una aproximación cercana $L \approxeq u$ (para un haploide; se muestra en la p. 153 y en otros lugares), en otras palabras, la carga no está relacionada en su mayoría con $s$ porque $s$ solo tiene efecto si $q_{e}$ no está cerca de cero, lo que rara vez es cierto para los nuevos mutantes.

2) A muy baja $s$ hay una mayor probabilidad de que el mutante vaya a la fijación (por ejemplo, alcance el $q_{e} = 1$ equilibrio) debido a la menor acción de la selección.

3) De (2), creo que esto significa que $s$ es entonces parte de la formulación de la carga de nuevo a baja $s$ .

4) Así como $s$ va a cero, la contribución de tales variantes todavía va a cero.

5) Joe también usa la paradoja del valor C/ADN basura/principio de cebolla para argumentar que la carga mutacional no se ve afectada por la mayor parte del genoma para genomas grandes, por ejemplo, humanos. Pero ese argumento parece decir que simplemente no deberíamos preocuparnos por estas regiones del genoma porque sus coeficientes de selección están en la región de insignificancia cercana a cero.

Pero estos no se resuelven formalmente aquí en el libro. ¿Alguien puede formular una expresión o aproximación para exactamente cómo podemos tratar la carga asociada con coeficientes de selección muy pequeños que se encuentran en la mayor parte de un gran genoma eucariótico?

Respuestas (1)

¿Cómo formulamos la carga mutacional del "ADN basura"?

Maximiliano Prensa · Answer 1

Terminé escribiendo directamente a Joe después de no obtener una respuesta externa aquí. No lo citaré directamente sin su permiso, pero para resumir, escribió lo siguiente:

Este documento (entre otros) brinda un tratamiento numérico de diferentes coeficientes de selección en poblaciones pequeñas, lo que efectivamente significa loci que no están bajo selección pero aún tienen coeficientes (que defino como ADN basura en mi pregunta). Muestra un declive suave (Figura 1) con decrecimiento $s$ y el tamaño de la población, lo que indica que mi instinto era correcto de que existe una carga para dicho ADN "basura".

Figura 1 de Kimura, Maruyama y Crow 1963

Joe se mostró bastante escéptico de que tales cargas fueran realmente significativas para la evolución, excepto en el caso de poblaciones muy pequeñas. Creo que esto también concuerda con mi intuición, pero como nota práctica importante, es importante no entusiasmarse demasiado con el ADN basura desde un punto de vista biológico (ver, por ejemplo, Graur et al. 2013).

¿Cómo formulamos la carga mutacional del "ADN basura"?

Maximiliano Prensa

Preguntas)

Posibles problemas con este

Fondo

Respuestas (1)

Maximiliano Prensa

Identidad por descendencia versus identidad por estado

¿Por qué el número de mutaciones por individuo sigue una distribución de Poisson?

Varianza en Fst en el modelo de isla infinita

¿Los heterocigotos son siempre más aptos que los homocigotos? ¿Puede ser beneficiosa la consanguinidad?

Modelos matemáticos de selección de linaje

Dentro y entre la diversidad de clases alélicas

Sobre el coeficiente de selección

Equilibrio de Hardy-Weinberg generalizado para agregar consanguinidad (apareamiento no aleatorio)

Recomendaciones de libros para modelos evolutivos

Comprender las estadísticas F en genética de poblaciones