¿Los simios y los humanos comparten el 99% del ADN o el 99% de los genes? ¿Cuál es la diferencia?

Hice una respuesta en Scifi.SE que se puede leer aquí . Se trata de cómo los personajes de la historia Jurassic Park podrían haber obtenido el ADN de todas las especies que se muestran.

En mi respuesta dije esto:

Los simios y los humanos, por ejemplo, comparten más del 99% de sus genes. Eso significa que la diferencia entre nuestras especies es menos del 1% de nuestros genes. De hecho, toda la vida en la Tierra comparte alrededor del 50% de sus genes.

pero en la publicación original (antes de que alguien la editara) elegí usar la palabra ADN en lugar de genes.

Dejó este comentario en la sección para explicar la edición:

Lo siento, soy biólogo, no puedo evitarlo. Los humanos y los simios comparten un 99 % de similitud en las secuencias de codificación de su ADN, el ~5 % que codifica los genes, no en todo el ADN. Simplifiqué esto a genes para la respuesta.

Tengo una comprensión básica de la escuela secundaria sobre el ADN y los genes, por lo que me temo que no veo la diferencia entre usar "ADN" o usar "genes" en mi declaración. Entiendo que los genes son secuencias específicas de ADN que la célula utiliza de alguna manera. Entiendo que el ADN es más genérico, incluidas todas las hebras, ya sea que se usen o no, ya sea que parezcan codificar algo o no.

Entonces, ¿es incorrecto decir que los simios y los humanos comparten el 99% de su ADN o es igualmente correcto decir "genes"?

Generalmente confío en lo que dice @terdon, es una persona bastante completa. Dicho esto, sería un poco más pedante y diría que los simios y los humanos comparten más del 99% de las secuencias de codificación (o ADN) en nuestros genes, justo en la respuesta, pero solo soy yo. Es técnicamente incorrecto decir que compartimos el 99% de nuestro ADN, por razones que explicaré a continuación...
@MattDMo sí, no quería usar la "secuencia de codificación" porque pensé que era demasiado técnico para el otro sitio. Soy lo suficientemente pedante como para no permitir que el "99% del ADN" permanezca sin ser cuestionado :).

Respuestas (6)

Entonces, una lección rápida de biología molecular.

  • Las proteínas son las cosas que constituyen un buen porcentaje de nuestras células (que constituyen un buen porcentaje de nosotros ), y son las cosas que hacen el trabajo de las células; muchas son catalizadores y se conocen como "enzimas".
  • Las proteínas están codificadas por genes , aunque la afirmación de que un gen codifica una proteína no es del todo correcta (un gen puede codificar diferentes variaciones de la misma proteína básica), es una buena forma de pensar en este contexto.

  • Los genes están formados por ADN , una molécula polimérica que constituye nuestros cromosomas, cuya porción informativa reside en cuatro “letras” (bases químicas).

  • Sin embargo, ahora llegamos a la parte clave: aunque todos los genes están hechos de ADN, no todo el ADN de los cromosomas forma genes . De hecho, como @terdon mencionó en un comentario, solo alrededor del 5% (o menos) de los 4 mil millones de letras en el ADN total, el genoma , constituyen genes, esas secuencias que
    codifican directamente la proteína.

  • La función del resto del genoma no está del todo clara. Algunos son regulatorios, otros pueden ser estructurales y pueden ser "ADN basura". Sin embargo, se ha mantenido durante millones de años, por lo que suponemos que debe tener algún propósito. Este ADN no codificante difiere entre especies en mayor medida que los propios genes, por lo que tal vez de alguna manera contribuya a las diferencias entre organismos.


Desde AndroidPenguin

Aquí están los enlaces a un artículo sobre la función del ADN "basura" de 2013.

  1. Resumen en NY Times

  2. abstracto en la naturaleza

  3. ENCODE hilos en nature.com

Nota al margen, las cosas de ENCODE sobre basura son, en el mejor de los casos, controvertidas y más fuertemente (admitidas por el consorcio) pura exageración; no estaba en el artículo revisado por pares, los investigadores sobre ADN basura lo consideran una tontería y no debe tratarse como una referencia válida.

Dado que fue mi edición de su pregunta lo que inició todo esto, también puedo opinar. Daré una versión simplificada de los genes y la transcripción de genes, hay varios detalles que hacen que el proceso sea mucho más complicado de lo que describiré, pero no son relevantes para la pregunta básica aquí.

En primer lugar, como han mencionado otros, los genes son secuencias específicas de ADN. El trabajo de un gen es "codificar" una proteína (primera gran simplificación). Sin embargo, no todos los genes codifican proteínas, solo aquellas partes llamadas exones (imagen ligeramente modificada de aquí ):

ingrese la descripción de la imagen aquí

El mensaje final de la imagen de arriba es que los bits rojos (los intrones ) se eliminan y no afectan el producto proteico final. Entonces, solo una parte del gen codifica la proteína. Los intrones tienden a estar mucho menos conservados entre diferentes especies que los exones.

No solo el gen completo no codifica proteínas, sino que la mayor parte del genoma no contiene genes. De hecho, en humanos, los genes representan ~5% del ADN total y los exones representan ~2%.

Otro factor de confusión son las secuencias denominadas elementos repetitivos . Estos son varios tipos de secuencias generalmente cortas que existen en muchas copias en los genomas. En el genoma humano, ~ 41% consiste en elementos repetitivos de varios tipos, y ~ 10% representa copias de un solo elemento (Alu), eso es el doble. como genes. Dichos elementos repetitivos generalmente no se consideran al calcular las tasas de similitud del genoma completo.

En términos de su genoma completo , humanos y chimpancés son muy, muy similares. Sin embargo, los porcentajes exactos varían (he visto estimaciones de ~ 85 a ~ 90 algo) dependiendo de la forma en que se estudien las secuencias. Para estar seguro, debe decir que comparten un 99% de similitud a nivel genético y dejarlo así.

Gracias por los detalles. Ahora que terminé mi primer curso de biología de nivel universitario, entiendo la mayor parte de esto cuando entendí muy poco cuando respondiste por primera vez. +1 pero no te di la selección porque la de Matt era mejor por la simplicidad y la organización de los pensamientos.

Solo para aclarar las definiciones, su genoma está formado por secuencias de ADN. El ADN está formado por pares de cuatro ácidos nucleicos o nucleótidos (A,G,T,C). Ese ADN tiene muchos loci en su interior, cada uno de los cuales codifica un gen. Los loci reciben nombres de genes como SHH (sonic hedgehog), que es parte de una disciplina llamada nomenclatura de genes . Los humanos tenemos dos versiones de cada gen, una de cada padre. Estos genes, como el SHH, tienen diferentes variantes llamadas alelos . Aquí es donde quizás hayas escuchado los términos homocigoto y heterocigoto, cuando una persona tiene dos copias del mismo alelo o dos diferentes respectivamente. Es posible que recuerde haber hablado sobre la anemia de células falciformes en la escuela secundaria.

Entonces, ¿es incorrecto decir que los simios y los humanos comparten el 99% de su ADN o es igualmente correcto decir "genes"?

Bueno, la similitud entre humanos y chimpancés en términos de secuencia de ADN conocida es de alrededor del 98,8 %, hay una divergencia de secuencia bastante baja, por lo que, en mi opinión, tienes razón al decir que comparten el 99 % de su ADN. Esto significa que en 100 nucleótidos hay aproximadamente una diferencia, por ejemplo (mostrando 90 bases, hechas usando una muestra aleatoria de cuatro letras en R):

Hebra de ADN humano:

atgactgtagcccatga t gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Chimpancé:

atgactgtagcccatga c gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Habiendo dicho eso, dado que hay >3,000,000,000 de pares de bases en el genoma humano (la secuencia de 4 nucleótidos que componen el ADN) eso equivale a ~36,000,000 de pares de bases diferentes (entre humanos y chimpancés), lo que probablemente equivale a una gran diferencia. A veces, incluso un polimorfismo de un solo nucleótido (SNP, pronunciado snip), un cambio en un solo par de bases, puede provocar cambios cuantificables:

una mutación de una sola base en el gen APOE (apolipoproteína E) se asocia con un mayor riesgo de enfermedad de Alzheimer.

Aquí hay una pequeña lectura sobre los humanos contra los chimpancés . Es posible que también desee ver esta publicación similar sobre biología SE .

Pero el editor de su publicación original tiene razón... solo se ha secuenciado la región eucromática.

"Los humanos y los simios comparten un 99% de similitud en las secuencias de codificación de su ADN"

A menudo se considera que la región eucromática es la parte del ADN que codifica la proteína y constituye el 92% del genoma (creo que esto es quizás el 92% de los genes, pero solo una pequeña parte del ADN físico).

El resto, la heterocromatina, contiene información no secuenciada y podría albergar algunas de las variaciones de ADN entre las dos especies. Algunos trabajos han sugerido que la heterocromatina, previamente etiquetada como ADN basura, en realidad tiene algún efecto sobre los rasgos. Por ejemplo, en Drosophila ha habido estudios que muestran los efectos del cromosoma Y en los rasgos a pesar de que el cromosoma Y es principalmente heterocromático.


Además: creo que una fuente común de confusión proviene del uso de la palabra gen. A menudo se usa indistintamente para significar alelo o locus genético . Cuando alguien dice que los humanos y los simios comparten el 99% de sus genes, quiere decir que comparten el 99% de sus loci genéticos. Cuando alguien dice que una persona comparte el 50% de sus genes con un padre, quiere decir que comparte la mitad de sus alelos con ese padre (es solo aproximadamente la mitad debido a la recombinación y la mutación). Un individuo tiene todos (salvo defectos genéticos como deleciones ) los mismos loci que sus padres.

La mayoría de las respuestas aquí se centran muy bien en la diferencia entre los conceptos de 'ADN' y 'genes'. Sin embargo, la identidad de la secuencia entre humanos y chimpancés no se trata con tanta rigurosidad y sigue sin estar clara a partir de las respuestas. Por lo tanto, daré más detalles sobre eso, de modo que también se cubra la primera parte de la pregunta.

Los humanos y los chimpancés difieren aproximadamente cada 100 nucleótidos en su secuencia de ADN total. Esto no significa que el 98,5% de los genes sean compartidos. Significa que los humanos tienen aproximadamente un 98,5 % (más precisamente, aproximadamente un 98,8 %, The Chimpanzee Sequencing and Analysis Consortium, 2005 ) de identidad de secuencia con los chimpancés, sin tener en cuenta los indeles . Trataron los indeles y las diferencias de nucleótidos por separado y "calcularon [d] la divergencia de nucleótidos en todo el genoma entre humanos y chimpancés en 1,23% ", que incluye regiones intergénicas e intrones, por lo que obviamente también regiones no génicas . La identidad de secuencia a nivel de gen es presumiblemente mucho más grande.

El Consorcio de análisis y secuenciación de chimpancés también proporciona información sobre cómo se estructura esta divergencia. La parte principal (alrededor del 85% de los 30 - 35 millones de nucleótidos diferentes) proviene de diferencias fijas : una diferencia fija es una posición en el genoma haploide en la que cada humano tiene, digamos, una G y cada chimpancé tiene una T. En consecuencia , el sitio es diferente entre las dos especies para cada individuo de la especie respectiva. La parte más pequeña (alrededor del 15%) proviene de sitios que son variables ( SNP ) en humanos o variables en chimpancés, o en ambos (incluso hay un pequeño número de variantes muy antiguas, es decir, alelos compartidos entre humanos y chimpancés, por ejemplo, verAzevedo et al., 2015 ). Tenga en cuenta que las estimaciones mejoran cuanto más individuos de las respectivas especies se secuencian y comparan.

Acabo de leer un artículo que dice que incluso la estadística del 99% no es técnicamente correcta. Para llegar a ese número tuvieron que ignorar el 25% del ADN humano y creo que el 18% del ADN del chimpancé. También asumo que la estadística solo incluía el ADN codificado. Porque si lo que solían llamar ADN basura no es lo mismo, entonces la estadística del 99% de 2005 comienza a parecer cada vez menos precisa y un poco engañosa. https://futurism.com/watch-do-we-really-share-99-our-dna-chimps/

No se trata solo del ADN codificante, sino también de todo el ADN no codificante. Además, la publicación que menciona la identidad de secuencia del 98,8 % menciona minuciosamente que esto no se relaciona con diferencias estructurales (indeles, etc.) ya que estas diferencias no se pueden cuantificar tan fácilmente. Sin embargo, también cubren diferencias estructurales en el artículo.

Los humanos y los chimpancés difieren aproximadamente cada 100 nucleótidos en su secuencia total de ADN. Esto no significa que el 98,5 % de los genes sean compartidos. 2005) identidad de secuencia con chimpancés, sin tener en cuenta los indeles. Trataron los indeles y las diferencias de nucleótidos por separado y "calcularon [d] la divergencia de nucleótidos en todo el genoma entre humanos y chimpancés en 1,23%", que incluye regiones intergénicas e intrones, por lo que obviamente también no Regiones génicas. La identidad de secuencia a nivel de genes es presumiblemente mucho más grande.

Siento que las matemáticas aquí no funcionan. ¿Cómo pueden 100 nucleótidos equivaler al 1,23% de la secuencia completa?