¿Son más prominentes las mutaciones de variación del número de copias SNP o SSR?

Estoy tratando de tener una idea de la forma dominante en que ocurren las mutaciones. He visto varios números que, al menos a primera vista, parecen estar en conflicto, y tenía curiosidad por saber si alguien tenía alguna aclaración al respecto.

Según Shastry, " alelos SNP en la enfermedad y evolución humana " ( Journal of Human Genetics 47:561–566, 2002),

En dos genomas humanos seleccionados al azar, el 99,9% de la secuencia de ADN es idéntica. El 0,1% restante del ADN contiene variaciones de secuencia. El tipo más común de dicha variación se denomina polimorfismo de un solo nucleótido o SNP.

Sin embargo, según Nevo, “ Diversidad Genética ” ( Enciclopedia de la Biodiversidad , 2001),

Significativamente, los SSR experimentan mutaciones a tasas notablemente más altas que las secuencias no repetitivas: 10 2 a 10 3 por locus, por gameto, por generación, lo que conduce a su alto polimorfismo.

Además, según Kashi y King, " Simple Sequence Repeats as Advantageous Mutators in Evolution ", ( TRENDS in Genetics 22(5):257),

Las mutaciones que alteran el número de repeticiones generalmente ocurren a tasas de órdenes de magnitud mayores que las mutaciones puntuales de un solo nucleótido.

Entonces, si las variaciones en los organismos se deben principalmente a los SSR, y esto es principalmente una variación del número de copias, ¿sería correcto decir que las variantes del número de copias en los SSR son la forma dominante de variación, o me estoy perdiendo algo? ¿Cuál es la correcta, o qué fuente tiene más autoridad, o hay una revisión más actualizada que debería consultar?

NOTA: agregué la palabra "mutaciones" al título de la pregunta para que quede más claro sobre lo que estoy preguntando.

Respuestas (2)

Me gusta la respuesta de @mgkrebbs, creo que toca la mayoría de los puntos altos, pero escribí una reseña sobre este tema hace un par de años donde reunimos estimaciones específicas sobre la carga mutacional de diferentes clases de mutaciones (ver Tabla 1).

El grupo de Yaniv Erlich abordó directamente la pregunta que está tratando de responder y estimó que los microsatélites contribuyen con un poco más de mutaciones por generación que sustituciones:

Estas predicciones indican que la carga de mutaciones STR [SSR] de novo es de al menos 75 mutaciones por generación, lo que rivaliza con la carga de todos los demás tipos de variantes conocidas.

La mayoría de las estimaciones de las tasas de mutación de sustitución general diploide son ~ 50/generación, a modo de comparación.

Sin embargo, si está interesado en el número total de variantes, también deberá tener en cuenta una arquitectura increíblemente compleja de variantes estructurales en básicamente cualquier genoma, incluidos también plásmidos, virus y transposones. Entonces, cuando habla de la "forma dominante de variación", realmente necesita ser un poco más específico. Por locus o incluso por clase de mutación, los STR/SSR probablemente sean "dominantes", pero es difícil argumentar que, por ejemplo, 1 mutación de STR es más importante que un salto de transposón o una aneuploidía cromosómica o una contracción de satélite centromérico.

Recomiendo leer los documentos vinculados para un poco más de contexto.

No me queda muy claro qué es lo que buscas cuando preguntas qué tan prominentes o dominantes son estos dos tipos de variaciones. Pero miremos más profundo.

Guichoux et al. (1) decir:

Hay dos diferencias principales entre los SSR y los SNP. Primero, los SNP son más numerosos que los SSR en el genoma de la mayoría de las especies. En promedio, en el genoma humano, hay un SNP cada 100–300 pb (Thorisson et al. 2005), en comparación con un locus SSR cada 2–30 kb (Webster et al. 2002), dependiendo de cómo se integren los SSR. definido (Kelkar et al. 2010). Esto puede ser importante para los estudios de asociación de todo el genoma, pero no necesariamente para otras aplicaciones. En segundo lugar, la tasa de mutación por generación difiere drásticamente entre los dos tipos de marcadores. Los SSR tienen tasas de mutación que van desde 10 3 a 10 4 por locus por generación (Ellegren 2000), en comparación con aproximadamente 10 9 para los SNP, es decir, varios órdenes de magnitud inferior. Como consecuencia, los SNP suelen ser dialélicos: en humanos, <0,1 % de los SNP son trialélicos (Lai 2001). Por el contrario, los loci SSR generalmente tienen una gran riqueza alélica, a menudo superior a 10 alelos.

Según estos números, los SNP ocurren quizás 80 veces más que los SSR. ¿Es eso más destacado?

Un SSR es más grande que un SNP, cubriendo quizás de cien a varios cientos de bases frente a una base (por definición). Un locus SSR también se presenta en múltiples variantes, por ejemplo, con un número de copias de un amplio rango, en comparación con solo dos variantes posibles que generalmente ocurren para un locus SNP.

Las tasas de mutación son sustancialmente diferentes, aparentemente típicamente 5 órdenes de magnitud más frecuentes para los SSR que para los SNP. Tenga en cuenta, sin embargo, que la tasa de mutación no afecta directamente la frecuencia de las variantes observadas en los genomas de los organismos existentes: las variantes presentes son el resultado de la filtración de mutaciones por las fuerzas de selección.

Tenga en cuenta también que todas las bases están sujetas a mutación, lo que produce un SNP, pero las mutaciones SSR solo ocurren donde ya existe una secuencia repetitiva. (Además, la probabilidad de mutación se vuelve significativa solo cuando la secuencia existente tiene más de unas pocas repeticiones, ya que el mecanismo de mutación depende de esto).

Sin embargo, una pregunta principal es ¿cuál es el significado de la variación? ¿Te interesa la variación solo porque marcan genomas individuales dentro de una población, o te interesa la variación de los fenotipos de los individuos? Algunos loci genéticos son irrelevantes para el fenotipo y algunos pueden afectar el fenotipo en mayor o menor grado. Los SNP pueden ocurrir en cualquier lugar, por lo que se puede suponer que tienen una probabilidad "justa" de afectar el fenotipo. Por otro lado, los SSR pueden ocurrir donde solo pueden ocurrir secuencias repetitivas (y persistir donde sobreviven a las fuerzas selectivas). Con los SSR, la variación del número de copias en algunos contextos, como las secuencias de codificación de proteínas, puede tener efectos de fenotipo más grandes que un SNP y, por lo tanto, estar sujeto a fuerzas de selección más fuertes.

Mi opinión es que tanto los SSR como los SNP son importantes y no es muy productivo preocuparse por la prominencia general o el dominio de uno sobre el otro.

Referencia:

(1) Guichoux, Erwan y Lagache, Lelia y Wagner, Stefanie y Chaumeil, Philippe y Léger, Patrick y Lepais, Olivier y Lepoittevin, Camille y Malausa, Thibaut y Revardel, Emmanuelle y Salin, Franck y Petit, Rémy. (2011). Tendencias actuales en el genotipado de microsatélites. Recursos de ecología molecular. 11. 591-611. 10.1111/j.1755-0998.2011.03014.x.

La razón por la que estoy interesado es porque creo que la naturaleza y el ritmo de la evolución están ligados al mecanismo de la mutación. Creo que hay relevancia para el modelado en genética de poblaciones. Si entiendo correctamente, está diciendo que existen muchos más SNP que variantes de SSR con número de copia. Por par de bases, predominan los SSR, pero, dado que son menos y más espaciados, esto podría no significar más instancias reales de mutación de SSR por generación, pero parece que podría favorecer a los SSR en aproximadamente un orden de magnitud ( 4 órdenes de magnitud menos en el genoma frente a 5 órdenes más probables)