Efecto sobre la aptitud de las mutaciones

¿Cuál es la función de distribución/densidad de probabilidad ( PDF ) de los impactos en la aptitud de las nuevas mutaciones?


Doy la bienvenida a cualquier respuesta parcial que no brinde el PDF completo, sino solo alguna información sobre el valor esperado o la varianza de esta distribución. Información del tipo: "Si consideramos solo mutaciones beneficiosas, entonces el PDF es PAG ( X = X ) = F ( X ) " también son bienvenidos.

Cuando digo mutaciones, uno podría querer reducir el concepto de mutaciones solo a indeles y mutaciones puntuales.

Por supuesto, la respuesta dependerá de la especie en cuestión y de una población a otra, pero agradezco cualquier respuesta que pueda brindar algunas ideas. Eventualmente, podría ser útil cierta información de acuerdo con lo que generalmente se supone que es la PDF de los efectos sobre la aptitud de las nuevas mutaciones.

Aquí hay una pregunta relacionada

Aquí hay un artículo que asume una distribución exponencial de efectos sobre la aptitud de las mutaciones beneficiosas.

el PDF debe ser condicional.
Además, su pregunta es bastante amplia y necesita un modelo racional para una respuesta razonablemente precisa.
@WYSIWYG ¿El PDF debe estar condicionado a qué? Sobre la especie. Si obviamente. Pero cualquier información será bienvenida. Reedité mi pregunta para aclarar lo que entiendo por mutación. No creo que mi pregunta sea demasiado amplia. Por favor, hágame saber si se le ocurre una forma de reducir mi pregunta.
se puede reducir tal vez asumiendo un modelo estadístico hipotético

Respuestas (2)

A una buena primera aproximación Δ F ¯ = 0 . Dónde Δ F ¯ es el cambio medio en la aptitud hasta cualquier punto o mutación indel. Las razones de esto son las siguientes:

  1. En el genoma de los organismos superiores, la mayor parte del genoma no es funcional ("basura"), por lo que la mayoría de las mutaciones no tendrán ningún efecto independientemente del cambio realizado.
  2. Una proporción sustancial de las mutaciones puntuales en el marco serán mutaciones sinónimas que darán como resultado que se codifique el mismo aminoácido (en realidad, esto puede tener un efecto en la expresión de proteínas, pero no creo que nadie haya mostrado, todavía, una diferencia de aptitud).
  3. Incluso cuando una mutación altera un aminoácido, muchos cambios de aminoácidos no tienen un efecto medible en la proteína producida. Especialmente cuando el nuevo aminoácido tiene propiedades similares al que ha reemplazado.
  4. Incluso cuando una mutación altera la función de la proteína o hace que el producto no funcione, en muchos casos esto no afectará la aptitud ya que la aptitud depende del entorno en el que se mide y no todos los genes afectan a todos los entornos.

Entonces, la distribución, sea lo que sea, tendrá un gran pico en 0. Probablemente este pico sea varios órdenes de magnitud más alto que el siguiente valor más alto. Además, podemos estar razonablemente seguros de que Δ F ¯ < 0 ya que hay más formas posibles de romper un gen a través de una mutación puntual o indel que mejorarlo. Si este es el caso, de modo que hay un gran exceso de mutaciones con un efecto negativo en la aptitud, podemos concluir que la distribución de los cambios mutacionales en la aptitud no será normal (sesgo negativo y pico en cero), y que la la distribución normal será una mala aproximación.

Me gusta tu razonamiento, pero no entiendo lo que quieres decir con la última oración.
Me recuerda a la optimización de Pareto. Pero el efecto de cada mutación en un gen aún tiene que ser muestreado.
@fileunderwater: si se deja sesgado y tiene un pico central en un valor exacto, por lo tanto, será mal aproximado por cualquier toma de la distribución normal.
@JackAidley Te tengo. Aclaración sugerida.
Echa un vistazo a este papel. Esto habla de un concepto similar al enfoque de Jack Aidley.

[Esto es puramente especulativo]

Suposiciones:

  • el impacto en la forma física se mide por la probabilidad de supervivencia
  • el impacto se debe a los genes que codifican proteínas

Probabilidad de una mutación en la posición i

PAG ( metro = i   |   gramo )

dónde gramo es el genoma con sus anotaciones.

Probabilidad de que la actividad de alguna proteína cambie X veces dada la mutación en i t h posición(es) en el genoma:

i gramo mi norte mi PAG ( a gramo mi norte mi = X   |   metro = i )

suma sobre todos los genes que ocupan ese locus.

Probabilidad de que ante una presión de selección dada S y cambio de actividad proteica X , el individuo sobrevive a la selección.

i gramo mi norte mi PAG ( 1   |   a gramo mi norte mi = X , S )

No soy un experto en modelado bayesiano. Pero supongo que esta es una forma de obtener el PDF. Cada paso debe expandirse y combinarse para obtener una ecuación para PDF.

No estoy seguro si esto es de alguna ayuda en absoluto.

Muchas gracias por tu respuesta. Aunque probablemente sea interesante, debo confesar que no entiendo todo. Realmente no entiendo por qué definir un locus como una secuencia lo suficientemente larga para que ocupe varios genes. No creo que realmente aborde la pregunta. Si S es la variable aleatoria de efecto que tiene una mutación, pregunto por la distribución de S : PAG ( S = s ) . O como dijiste, eso podría, bajo algunos supuestos, corresponder a PAG ( a gramo mi norte mi = X | metro = i ) pero no hay necesidad de sumar todas las mutaciones en el genoma. No estoy preguntando sobre el efecto de la suma de todas las mutaciones.
No creo que un modelo puramente teórico pueda dar mucha información (o solo un modelo considerando la compleja red de interacciones de proteínas), pero podría estar equivocado.
Por varios genes me refiero a variantes de empalme que ocupan el mismo locus genómico. Solo considerando todas las posiciones en el genoma podremos obtener un PDF. Y en este caso el efecto de una mutación se denota por la variable aleatoria X , mientras S es la presión de selección ejercida. Estoy totalmente de acuerdo en que un modelo puramente teórico no dará muchas ideas. En este caso, las probabilidades previas deben calcularse a partir de observaciones experimentales. Pero con un modelo podemos hacer mejores predicciones.