Basado en el libro de texto de Joe Felsenstein, estaba tratando de formular la carga mutacional para la mayoría de los genomas eucariotas que son ADN basura ( ). (Consulte la sección de antecedentes para obtener más detalles y citas relevantes).
Extrapolando lo que Joe escribe sobre loci no basura y eliminando una suposición simplificadora (Muller-Haldane), creo que esto debería ser igual a la frecuencia alélica de cada locus (simplificando aquí al promedio de estos loci, ) multiplicado por cualquier coeficiente de selección infinitesimal que tenga cada locus ( , en promedio), sumados en todos los loci ( ):
(Idealmente, sumaríamos esto a través de estimaciones individuales de y para cada lugar geométrico, pero eso obviamente no es práctico aquí, así que usamos la media entre los lugares geométricos).
Aquí hay algunas preguntas estrechamente relacionadas:
1) ¿Es lo anterior una formulación razonable para ? Si no, ¿cuál sería? (Puedo imaginar fácilmente que muchas suposiciones comienzan a romperse con cientos de millones de posiciones, etc.)
2) Si es una formulación razonable, ¿cuáles son los rangos de parámetros "razonables" para y de mutantes casi neutrales "perjudiciales" para esta mayoría del genoma? (Por ejemplo, podríamos decir que puede tomar valores menores que el inverso del tamaño de la población.)
Tenga en cuenta que estoy hablando de ADN basura, no de ADN no codificante. Sabemos bastante sobre la carga mutacional del ADN no codificante (no basura) .
Introduzcamos algunos valores aquí, digamos a través de mil millones de loci con coeficientes de selección muy pequeños de y igual a la tasa de mutación de (por ejemplo, todas las variantes perjudiciales son mutaciones nuevas), puedo escribir:
Este es un subconjunto de la carga mutacional general. Para estos valores de parámetros, eso parece plausible, pero si tomamos en serio el argumento de Joe (ver más abajo) de que muchos de estos loci corregirán variantes perjudiciales, por ejemplo , entonces este valor podría llegar a ser bastante alto.
Por ejemplo, aquí hay un cálculo diferente asumiendo que :
¡Esa es una carga no trivial!
De hecho, asintóticamente esperamos que cada locus corrija variantes ligeramente perjudiciales. En este caso de variantes ligeramente perjudiciales universalmente fijadas, esta carga está más cerca de para el ejemplo anterior. Para las coníferas y los ajolotes con genomas de >10 Gbp, esperaríamos que la carga solo del ADN basura fuera mayor que 1 para estos valores de parámetros, por ejemplo, muertos. Joe tiene una sección "¿Por qué no estamos todos muertos?" pero no aborda esto directamente, y utiliza principalmente argumentos verbales.
Estoy refrescando mi conocimiento de la carga mutacional leyendo la sección del libro de Joe Felsenstein sobre el tema (págs. 152-158), y ahora estoy recordando algo con lo que luché mientras tomaba la clase que él impartía sobre el tema.
Joe escribe en la sección "Selección débil y carga mutacional":
Como se dice que la carga mutacional es una función de la tasa de mutación, pero no del coeficiente de selección, es natural preguntarse cómo una selección muy débil podría imponer una carga. Seguramente el principio de Haldane-Muller no puede sostenerse hasta . Por supuesto, no lo hace. En el caso haploide, la frecuencia del gen del equilibrio mutacional solo es correcto si , de lo contrario el único equilibrio del sistema (III-21) es . Si , de modo que , la carga es , de modo que cuando consideramos casos con valores progresivamente más pequeños de , la carga permanecerá hasta , luego, por debajo de ese punto, la carga disminuirá suavemente hasta cero a medida que s disminuya.
(Dónde es el coeficiente de selección para un alelo mutante, es la frecuencia del alelo mutante, y es la tasa de mutación en ese locus.)
Joe luego habla de otras cosas y concluye:
La carga será una función simple de a menos que es tan pequeño que no es sustancialmente mayor que . Por debajo de ese punto, la carga se reducirá a cero a medida que hace _
Esta última oración (mi énfasis) no es obvia para mí según lo que he leído.
Tengo problemas para seguir esta lógica. Esto es lo que entiendo al respecto:
1) Muller-Haldane afirma que tiene muy poco impacto en , tal que con una aproximación cercana (para un haploide; se muestra en la p. 153 y en otros lugares), en otras palabras, la carga no está relacionada en su mayoría con porque solo tiene efecto si no está cerca de cero, lo que rara vez es cierto para los nuevos mutantes.
2) A muy baja hay una mayor probabilidad de que el mutante vaya a la fijación (por ejemplo, alcance el equilibrio) debido a la menor acción de la selección.
3) De (2), creo que esto significa que es entonces parte de la formulación de la carga de nuevo a baja .
4) Así como va a cero, la contribución de tales variantes todavía va a cero.
5) Joe también usa la paradoja del valor C/ADN basura/principio de cebolla para argumentar que la carga mutacional no se ve afectada por la mayor parte del genoma para genomas grandes, por ejemplo, humanos. Pero ese argumento parece decir que simplemente no deberíamos preocuparnos por estas regiones del genoma porque sus coeficientes de selección están en la región de insignificancia cercana a cero.
Pero estos no se resuelven formalmente aquí en el libro. ¿Alguien puede formular una expresión o aproximación para exactamente cómo podemos tratar la carga asociada con coeficientes de selección muy pequeños que se encuentran en la mayor parte de un gran genoma eucariótico?
Terminé escribiendo directamente a Joe después de no obtener una respuesta externa aquí. No lo citaré directamente sin su permiso, pero para resumir, escribió lo siguiente:
Figura 1 de Kimura, Maruyama y Crow 1963