¿Cuál es el porcentaje de similitud entre los individuos humanos (y otros primates) al comparar solo los exones?

En libros y artículos de divulgación científica, a menudo veo que los humanos son más del 99 % similares entre sí (wikipedia tiene un 99,5 %, haciendo referencia a Craig Venter y este artículo de Biología de PLOS ) y ~96-99 % similares a los chimpancés o bonobos. ( Instituto Smithsonian , National Geographic ). Anteriormente pensé que esto se refería a todo el genoma, pero la redacción en la página del Instituto Smithsonian que vinculé hace que parezca que podría referirse solo a los genes, lo que también parece ser el caso de acuerdo con las respuestas a esta publicación Do simios y los humanos comparten el 99% del ADN o el 99% de los genes? ¿Cuál es la diferencia? .

¿Qué tan grandes son estos porcentajes cuando se comparan solo las regiones codificantes (exones) en lugar de genes completos, tanto dentro de nuestra especie como en comparación con otras especies, como los primates? Y, no tan importante, ¿cuáles son estos números cuando se incluye el genoma completo con todo el ADN no codificante?

Respuestas (2)

Una de las referencias al artículo sobre el genoma del chimpancé vinculado por Maximillian es Inferring Nonneutral Evolution from Human-Chimp-Mouse Orthologous Gene Trios , donde los autores parecen haberse centrado solo en los exones:

Aquí aplicamos pruebas evolutivas para identificar genes y vías de una nueva colección de más de 200 000 secuencias exónicas de chimpancés que muestran patrones de divergencia consistentes con la selección natural a lo largo de los linajes humanos y de chimpancés.

Concluyen que:

Quizás la mejor manera de entender la relación entre la divergencia de la secuencia de ADN y las diferencias entre la fisiología y la morfología de humanos y chimpancés es comparar estas diferencias con la variabilidad entre humanos. La divergencia de la secuencia de ADN humano-chimpancé es aproximadamente 10 veces la divergencia entre pares aleatorios de humanos.

Desafortunadamente, no compararon esto con la diferencia de veces del ADN no exónico, por lo que queda por determinar la cuantificación comparativa entre las regiones codificantes y no codificantes.

Sin embargo, esto responde directamente a la pregunta de cuán grandes son las diferencias genómicas entre individuos de la misma especie frente a los de otras especies, cuando se comparan solo las regiones codificantes. También me resultó útil cuantificar las diferencias en estos términos relativos además de los porcentajes indicados anteriormente.

Este documento parece tener estimaciones relevantes para las divergencias entre humanos y simios. Tenga en cuenta nuevamente que no está usando el genoma completo, sino regiones seleccionadas de exones, intrones, pseudogenes, etc. El documento del genoma del chimpancé tiene una buena lista de viñetas hacia el comienzo de las estadísticas relevantes para usted para esa especie específicamente, es decir del orden del 1% en total. La sección sobre "evolución de genes" tiene algunos números específicos para codificar secuencias.

Para la variación entre humanos, hay una página de bionúmeros sobre ese tema basada en los números del proyecto 1000 genomas, que arroja una divergencia del 0,1% entre los humanos.

Corrígeme si me perdí algo (no leí el documento completo), pero ¿el primer documento que vinculó específicamente no usa regiones de codificación? Del resumen: "...seleccionamos 53 segmentos de ADN no repetitivos intergénicos autosómicos..."
El documento sobre el genoma del chimpancé afirma: "Cuando los sitios CpG y no CpG se consideran por separado, encontramos que tanto los sitios CpG como los sitios no CpG muestran una divergencia notablemente menor en los sitios sinónimos exónicos que en los intrones (~50 % y ~30 % menos, respectivamente)." Para mí, esto indica que las diferencias entre especies dentro de las regiones exónicas serían más pequeñas que dentro de las regiones intrónicas...
... Según tengo entendido, esto se debe a las restricciones de supervivencia impuestas a las regiones exónicas, es decir, algunas mutaciones exónicas matan al organismo y no se transmitirán a la descendencia, mientras que las mutaciones en las regiones no exónicas no afectan la supervivencia de la misma medida. Sin embargo, esta no es mi área de especialización, por lo que me alegra saber si he malinterpretado algo.
Primer comentario: tenga en cuenta que la Tabla 5 del primer documento compara las distancias de la región de codificación. Nuevamente, probablemente no sea el mejor ejemplo porque solo se trata de regiones seleccionadas; pero en mi experiencia, estas estimaciones tienden a no cambiar drásticamente con el tamaño de la muestra.
Comentarios 2+3: Tiene razón en que el mecanismo para la menor tasa de divergencia en los exones se debe a la selección. De hecho, la inferencia de fragmentos de secuencia funcionalmente importantes mediante análisis comparativo depende de esto; véase, por ejemplo, compgen.cshl.edu/~acs/phylohmm.pdf . Pero eso no parecía ser parte de la pregunta original. Existe una gran cantidad de literatura sobre este tema, pero para una revisión concisa de un autor conocido, puede consultar sciencedirect.com/science/article/pii/S0959437X02003489 . Tenga en cuenta que la variación entre sitios en la divergencia también es importante en las proteínas.