SNP en el genoma humano

Leí en línea que han encontrado alrededor de 10 millones de polimorfismos de un solo nucleótido (SNP) en individuos del genoma humano [1] . Sin embargo, este número incluye todos los SNP encontrados en todas las personas que han sido muestreadas y no nos dice mucho sobre los SNP en una sola persona.

En cambio, me preguntaba cuántos SNP hay en una sola persona en promedio. Tuve problemas para encontrar evidencia confiable sobre esta pregunta.

Respuestas (3)

Me preguntaba cuántos SNP hay en una sola persona en promedio

Un SNP es un polimorfismo en la población, no es algo que un haplotipo pueda portar. Cada individuo tiene una variante determinada para cualquiera de los SNP (excepto en los casos de supresión de secuencia).

Sin embargo, es posible decir cuántos SNP tiene un individuo diploide entre sus dos haplotipos, pero dudo que esto sea lo que le interese. La fórmula de muestreo de Ewens da la expectativa y la distribución bajo un modelo de alelos infinitos, población panmíctica y ausencia de selección.

Otras estadísticas que tienen sentido incluyen el número promedio de mutaciones deletéreas antes del individuo o algunas otras cosas o cuántas mutaciones nuevas transmite una pareja a su descendencia... Pero preguntar cuántos SNP tiene un individuo en promedio tiene poco sentido.

Tenga en cuenta que, como dijo @Chris, al indicar 10k SNP en el genoma humano, parece subestimar la cantidad de SNP.

EDITAR

En los comentarios, además

¿Tendría más sentido considerar un mínimo y un máximo aproximados?

La respuesta es no, no tendría más sentido. Considere la definición de SNP por wikipedia

Un polimorfismo de un solo nucleótido, a menudo abreviado como SNP (pronunciado snip; plural snips), es una variación en un solo nucleótido que ocurre en una posición específica en el genoma, donde cada variación está presente en un grado apreciable dentro de una población [ Mi énfasis ]

El término población es clave aquí. El concepto de SNP (o de polimorfismo para ser más generales) solo tiene sentido si se pueden hacer comparaciones. Un solo individuo no tiene ningún polimorfismo (a excepción del que se encuentra entre sus dos juegos de cromosomas).

Si damos un paso atrás y pensamos en diferentes especies, podría volverse más intuitivo. Piensa en el número de diferencias por pares entre dos especies. No tiene ningún sentido preguntar "¿cuántas diferencias por pares hay entre una ballena azul?" Tienes que decir "cuántas diferencias por parejas hay entre una ballena azul y un lobo". De manera similar, no puede decir "¿Cuántos SNP hay 'entre un solo individuo'" (con la excepción nuevamente de la consideración de las diferencias entre los dos conjuntos de cromosomas), necesita considerar un grupo de individuos.

"Pero preguntar cuántos SNP lleva un individuo en promedio tiene poco sentido". Tiene sentido. La heterocigosidad en los individuos es un indicador útil de la diversidad genética en la población.
Seguro que podemos comparar los dos haplotipos (como dije en el segundo párrafo). Esto no es heterocigosidad (ni heterocigosidad observada), sino solo un número promedio de diferencias por pares entre haplotipos dentro de cada individuo. Solo dudo que esto sea lo que buscaba el OP, pero tal vez me equivoque en las intenciones del OP.
Mi campo de especialización es la informática. He iniciado un proyecto de bioinformática cuya entrada sería un documento vcf de SNP (de un individuo humano). Estoy interesado en el promedio por razones prácticas y de optimización, en lugar de razones científicas biológicas. Pero como dijiste, no hace falta considerar el promedio. ¿Tendría más sentido considerar un mínimo y un máximo aproximados?
@BARJ Consulte la edición. Espero que ayude.

Solo pude encontrar una fuente, decía que cada genoma contiene 1 SNP cada 1000 pb. (Echa un vistazo aquí ). Sin embargo, no tengo idea si esta fuente es confiable.

Su número es demasiado bajo, el proyecto 1000 Genomes enumera aproximadamente 15 Mio SNP (consulte la referencia 1). Para averiguar cuántos SNP tienen los humanos en promedio (esto depende, por supuesto, de las poblaciones, donde esto puede diferir), a menudo se encuentra que en promedio 1 de cada 1000 nucleótidos se altera si se comparan dos genomas humanos (o al revés: ellos son 99.9% idénticos).

El problema con este número es que es bastante antiguo y se remonta a una publicación de 1991 (ver referencia 2), que comparaba 75.000 secuencias de nucleótidos de 49 loci. Dado que esto fue antes de que se conociera la secuencia completa del genoma humano, trataría este número con cierta precaución.

El número más reciente que encontré en esto es de la publicación del genoma humano. Estiman el número un poco más bajo, alrededor de 1 en 1300 bases (ver referencia 3).

Lo que se podría hacer con los datos del Proyecto 1000 Genomas es descargar los datos de las muestras individuales, mapearlos contra el genoma de referencia y ver cuántos SNP ocurren por individuo. No estoy seguro si nadie hizo eso o si simplemente lo pasé por alto.

Según estos datos, hay entre 2,3 y 3 millones de SNP (1:1000 o 1:1300 respectivamente) presentes en cada genoma humano. Según el proyecto 1000 Genomes (referencia 1), la tasa de SNP nuevos es 1 × 10 8 , lo que significa que hay entre 20 y 30 nuevos SNP por generación.

Referencias:

  1. Un mapa de la variación del genoma humano a partir de la secuenciación a escala de población
  2. Baja diversidad de nucleótidos en el hombre.
  3. Secuenciación inicial y análisis del genoma humano.