Leí en línea que han encontrado alrededor de 10 millones de polimorfismos de un solo nucleótido (SNP) en individuos del genoma humano [1] . Sin embargo, este número incluye todos los SNP encontrados en todas las personas que han sido muestreadas y no nos dice mucho sobre los SNP en una sola persona.
En cambio, me preguntaba cuántos SNP hay en una sola persona en promedio. Tuve problemas para encontrar evidencia confiable sobre esta pregunta.
Me preguntaba cuántos SNP hay en una sola persona en promedio
Un SNP es un polimorfismo en la población, no es algo que un haplotipo pueda portar. Cada individuo tiene una variante determinada para cualquiera de los SNP (excepto en los casos de supresión de secuencia).
Sin embargo, es posible decir cuántos SNP tiene un individuo diploide entre sus dos haplotipos, pero dudo que esto sea lo que le interese. La fórmula de muestreo de Ewens da la expectativa y la distribución bajo un modelo de alelos infinitos, población panmíctica y ausencia de selección.
Otras estadísticas que tienen sentido incluyen el número promedio de mutaciones deletéreas antes del individuo o algunas otras cosas o cuántas mutaciones nuevas transmite una pareja a su descendencia... Pero preguntar cuántos SNP tiene un individuo en promedio tiene poco sentido.
Tenga en cuenta que, como dijo @Chris, al indicar 10k SNP en el genoma humano, parece subestimar la cantidad de SNP.
EDITAR
En los comentarios, además
¿Tendría más sentido considerar un mínimo y un máximo aproximados?
La respuesta es no, no tendría más sentido. Considere la definición de SNP por wikipedia
Un polimorfismo de un solo nucleótido, a menudo abreviado como SNP (pronunciado snip; plural snips), es una variación en un solo nucleótido que ocurre en una posición específica en el genoma, donde cada variación está presente en un grado apreciable dentro de una población [ Mi énfasis ]
El término población es clave aquí. El concepto de SNP (o de polimorfismo para ser más generales) solo tiene sentido si se pueden hacer comparaciones. Un solo individuo no tiene ningún polimorfismo (a excepción del que se encuentra entre sus dos juegos de cromosomas).
Si damos un paso atrás y pensamos en diferentes especies, podría volverse más intuitivo. Piensa en el número de diferencias por pares entre dos especies. No tiene ningún sentido preguntar "¿cuántas diferencias por pares hay entre una ballena azul?" Tienes que decir "cuántas diferencias por parejas hay entre una ballena azul y un lobo". De manera similar, no puede decir "¿Cuántos SNP hay 'entre un solo individuo'" (con la excepción nuevamente de la consideración de las diferencias entre los dos conjuntos de cromosomas), necesita considerar un grupo de individuos.
Solo pude encontrar una fuente, decía que cada genoma contiene 1 SNP cada 1000 pb. (Echa un vistazo aquí ). Sin embargo, no tengo idea si esta fuente es confiable.
Su número es demasiado bajo, el proyecto 1000 Genomes enumera aproximadamente 15 Mio SNP (consulte la referencia 1). Para averiguar cuántos SNP tienen los humanos en promedio (esto depende, por supuesto, de las poblaciones, donde esto puede diferir), a menudo se encuentra que en promedio 1 de cada 1000 nucleótidos se altera si se comparan dos genomas humanos (o al revés: ellos son 99.9% idénticos).
El problema con este número es que es bastante antiguo y se remonta a una publicación de 1991 (ver referencia 2), que comparaba 75.000 secuencias de nucleótidos de 49 loci. Dado que esto fue antes de que se conociera la secuencia completa del genoma humano, trataría este número con cierta precaución.
El número más reciente que encontré en esto es de la publicación del genoma humano. Estiman el número un poco más bajo, alrededor de 1 en 1300 bases (ver referencia 3).
Lo que se podría hacer con los datos del Proyecto 1000 Genomas es descargar los datos de las muestras individuales, mapearlos contra el genoma de referencia y ver cuántos SNP ocurren por individuo. No estoy seguro si nadie hizo eso o si simplemente lo pasé por alto.
Según estos datos, hay entre 2,3 y 3 millones de SNP (1:1000 o 1:1300 respectivamente) presentes en cada genoma humano. Según el proyecto 1000 Genomes (referencia 1), la tasa de SNP nuevos es , lo que significa que hay entre 20 y 30 nuevos SNP por generación.
Referencias:
AlexDeLarge
Remi.b
BARJ
Remi.b