¿Por qué los genomas de los humanos son 99.5% iguales?

Se dice que la secuencia de ADN humana es aproximadamente 99.5% igual . Según tengo entendido, esto significa que si me acercara a usted y comparara nuestro ADN, la secuencia de pares de bases sería 99,5% igual.

Mi pregunta es: ¿Por qué hay solo un 0,5% de variación en nuestro ADN? Puedo pensar en dos razones:

  1. Por alguna razón, el otro 99,5% (aproximadamente) está bloqueado. Estas secciones, si se modifican, dan como resultado que no seamos 'humanos', o simplemente contraemos algún tipo de enfermedad genética y, por lo tanto, no son mutaciones muy buenas.

  2. No ha habido suficiente tiempo. Recuerdo haber escuchado que todos los humanos tienen un ancestro común hace mucho tiempo. Si ese es el caso, tal vez con el tiempo solo alrededor del 0.5% de nuestro ADN haya tenido tiempo de mutar aleatoriamente, y si esperamos mucho, mucho, mucho tiempo, más y más de nuestro ADN mutará, y seremos 'menos como cada uno'. otro'.

¿O estoy malinterpretando completamente la situación? No tomé biología en la escuela secundaria, así que las respuestas deben ser simples, por favor.

Una respuesta completa deberá profundizar bastante en el campo de la genética de poblaciones y llevará tiempo brindar el conocimiento introductorio necesario. Pero en breve, la respuesta definitivamente no es 1. y está bastante cerca de 2 :)
@ Remi.b Gracias por la información rápida, ¿sabría dónde puedo obtener recursos en línea para comenzar a aprender sobre genética de poblaciones? (o cualquier cosa que pueda ayudarme a entender esto mejor)
Es un poco frustrante recibir como respuesta "aprenda más", pero puede encontrar recomendaciones de libros sobre genética de poblaciones aquí . Es posible que primero desee seguir un curso de introducción a la biología evolutiva como Comprensión de la evolución (recurso gratuito en línea).
@JoshuaLin No estoy seguro de si se le notifican las ediciones de las respuestas. Hice algunas adiciones sustanciales a mi respuesta para proporcionar más detalles, con suerte para abordar diferentes detalles de su pregunta,

Respuestas (1)

En un genoma que tiene 3 mil millones de pares de bases, una diferencia del 0,5% equivale a una diferencia de 15 millones de bases. Cuando un solo cambio de base puede cambiar la secuencia de aminoácidos de una proteína, eso puede sumar una gran cantidad de diversidad, que es lo que vemos en los casi 8 mil millones de humanos en el planeta, y el 99.5 % de uniformidad es la razón por la que estamos unidos tan estrechamente como una especie.

¿Cómo se explica la falta de diversidad?

Nada en biología tiene sentido excepto a la luz de la evolución.

La cita anterior fue hecha por el biólogo evolutivo Theodosius Dobzhansky. Lo que esto significa básicamente es que debe analizar su pregunta desde la perspectiva de la evolución y la selección natural.

Lo primero que debe tener en cuenta es que hay evidencia que sugiere que los humanos modernos pasaron por un cuello de botella demográfico. Lo que eso significa es que, en cierto punto de nuestra historia, había muy pocos miembros vivos de nuestra especie y esto puede explicar la "falta" de diversidad que vemos en nuestro genoma. El número que se cita es tan bajo como 10.000 individuos que quedaron vivos después de la supererupción del volcán Toba hace unos 75 mil años.

Eso significa que quedaron muy pocas parejas de apareamiento, y eso redujo significativamente la diversidad genética de nuestra especie. Esto se conoce como Efecto Fundador.

Efectos fundadores

Un efecto fundador ocurre cuando unos pocos miembros de la población original inician una nueva colonia. Este pequeño tamaño de población significa que la colonia puede tener:

  • variación genética reducida de la población original.
  • una muestra no aleatoria de los genes en la población original.

Entonces, si usamos un promedio de 20 a 25 años por generación humana, solo estamos viendo alrededor de 3000 a 4000 generaciones, ya que tal vez solo hubo unas pocas miles de parejas reproductoras de humanos. Compare eso con las bacterias que pueden pasar de tres a cuatro mil generaciones en menos de una semana, y puede comenzar a tener una idea de por qué hay tanta homología de secuencia (igualdad) en el genoma humano. Consulte Cuellos de botella y efectos fundadores en el sitio Comprensión de la evolución de UC Berkley para obtener más información.

También debe comprender que cualquier cambio que sea perjudicial estará bajo una fuerte presión selectiva. Esto puede no significar que el organismo no sobreviva para reproducirse, sino que, en promedio, puede tener menos éxito; menos descendencia que tienen menos descendencia en comparación con el resto de la población. En algún momento, ese linaje puede extinguirse, ya sea porque el cambio hace que sea muy difícil sobrevivir, o porque la descendencia hace parejas menos deseables y, finalmente, no tiene la oportunidad de reproducirse.

Cualquier cambio que interrumpa un gen vital probablemente será fatal y conducirá a un aborto espontáneo o, si la mutación se mantuvo en un espermatozoide, entonces la incapacidad de ese esperma para sobrevivir para fertilizar un óvulo, por lo que el esperma que estaba muy mutado puede que nunca hacerlo al huevo. El número medio de espermatozoides en una sola eyaculación humana es de unos 250 millones. Y, sin embargo, solo un espermatozoide logra fertilizar el óvulo, y eso suponiendo que se produzca un evento de fertilización. Hay una increíble cantidad de selección que ocurre en el acto de la procreación, incluso antes de que lleguemos al desarrollo.

Por qué la cifra del 99,5 % al 0,5 % podría ser una representación errónea de la población en su conjunto.

Otra cosa en la que querrá pensar es cómo se llegó al número de 0,5% a 99,5%. La referencia en la pregunta enlaza con un artículo de Wikipedia Variación genética humana . La referencia provista para esto fue de un artículo del New York Times sobre J. Craig Venter, In the Genome Race, the Sequel Is Personal - Wade, Nicholas. 4 de septiembre de 2007. La cita a la que se hace referencia en Wikipedia es:

Los biólogos habían estimado que dos individuos serían idénticos en el 99,9 por ciento de su ADN, pero la cifra real ahora surge como mucho menos, alrededor del 99,5 por ciento, dijo el Dr. Scherer.

La cifra del 0,5 % se proporciona como una cita de Stephen W. Scherer, quien fue coautor de este artículo, The Diploid Genome Sequence of an Individual Human , Levy, et.al. PLoS Biología; 4 de septiembre de 2007. DOI: 10.1371/journal.pbio.0050254. De ese documento se encuentra la siguiente cita:

La inclusión de la variación genética de inserción y eliminación en nuestras estimaciones de la diferencia intercromosómica revela que solo existe un 99,5% de similitud entre las dos copias cromosómicas de un individuo y que la variación genética entre dos individuos es hasta cinco veces mayor que la estimada previamente.
- La secuencia del genoma diploide de un ser humano individual , Levy, et.al. PLoS Biología; 4 de septiembre de 2007.
DOI: 10.1371/journal.pbio.0050254

Entonces, al menos, la declaración se hizo en un artículo revisado por pares. Sin embargo, hay algunos problemas con esto.

El primero es el método del papel. Examina un solo genoma humano, el del Dr. Venter, y se utiliza para sacar la conclusión de una diferencia del 0,5 % entre dos individuos cualesquiera. Y la comparación se hace en base al análisis de diferencias entre los cromosomas maternos del Dr. Venter y los cromosomas paternos. Veamos cuáles podrían ser los problemas aquí:

  • Es un gran salto de fe estadística suponer que un solo genoma es representativo de los casi 8 mil millones de genomas que existen.
  • La genealogía del Dr. Venter es inglesa en ambos linajes parentales. Hay que recordar que hubo otro cuello de botella demográfico en la Europa medieval provocado por los brotes de cólera y la peste negra . Este hecho puede implicar que los linajes del Dr. Venter son genéticamente cercanos y que si su linaje fuera más diverso, por ejemplo, indígenas de Oceanía e ingleses, podrían haber encontrado una diferencia porcentual mucho mayor entre los cromosomas maternos y paternos.

El pedigrí de tres generaciones del donante se muestra en la Figura 1A. El donante tiene tres hermanos y un hijo biológico, su padre falleció a los 59 años de un paro cardíaco repentino. Hay casos documentados de familiares con enfermedades crónicas como hipertensión y cáncer de ovario y piel. Según el registro genealógico, los antepasados ​​del donante se remontan a 1821 (paterno) y 1700 (materno) en Inglaterra. El genotipado y el análisis de conglomerados de 750 loci de SNP únicos descubiertos a través de este proyecto respaldan que el donante es de hecho un 99,5 % similar a los individuos de ascendencia europea (Figura 1B), de acuerdo con el autoinforme.
- La secuencia del genoma diploide de un ser humano individual , Levy, et.al. PLoS Biología; 4 de septiembre de 2007.
DOI: 10.1371/journal.pbio.0050254

  • El Dr. Venter es hombre. El cromosoma Y fue problemático para secuenciar, y realmente no se puede hacer una comparación entre él y el cromosoma X. ¿Cómo se compararía el genoma de una mujer?

El cromosoma Y está cubierto en un 59% por el mapeo uno a uno debido a las dificultades al producir una comparación entre cromosomas ricos en repeticiones. Además, el cromosoma Y tiene una cobertura más pobre debido a las dificultades para ensamblar regiones complejas con una profundidad de cobertura de secuenciación de solo la mitad de la porción autosómica del genoma. La cobertura del cromosoma X con andamios HuRef es del 95,2 %, lo que es típico del nivel de cobertura de los autosomas (promedio del 98,3 % usando corridas). Sin embargo, está claro que el cromosoma X tiene más lagunas, como lo demuestra la cobertura con coincidencias (89,4 %) en comparación con la cobertura media de los autosomas que usan coincidencias (97,1 %). Los efectos generales de una cobertura de secuencia más baja en los cromosomas X e Y son claramente evidentes como un fuerte aumento en el número de espacios por unidad de longitud y andamios más cortos en comparación con los autosomas (Figura 3). La similitud entre los cromosomas sexuales es otra fuente de dificultades de ensamblaje y mapeo. Por ejemplo, hay un andamio de 1,5 Mb que se asigna igualmente bien a regiones idénticas de los cromosomas X e Y y, por lo tanto, no se puede asignar de forma única a ninguno de los dos (consulte Materiales y métodos y la Figura 3). A partir de nuestros datos de mapeo uno a uno, también podemos detectar el enriquecimiento de grandes duplicaciones segmentarias10 en los cromosomas 9, 16 y 22, lo que da como resultado una cobertura reducida debido a las dificultades de ensamblaje y mapeo (Tabla S3).
- La secuencia del genoma diploide de un ser humano individual , Levy, et.al. PLoS Biología; 4 de septiembre de 2007.
DOI: 10.1371/journal.pbio.0050254

Hay otra cosa que debes recordar y es la historia del Proyecto Genoma Humano. El Dr. Venter desarrolló un nuevo método de secuenciación y se convirtió en un competidor comercial del proyecto del Consorcio Internacional de Secuenciación del Genoma Humano. Mientras que el proyecto del Consorcio Internacional de Secuenciación del Genoma Humano venció a la empresa del Dr. Venter ( 8), su enfoque, usar una fusión del ADN de muchos donantes, algunos de los cuales tenían su ADN incluido y otros no, para preservar el anonimato, el Dr. Venter eludió esto realizando la secuenciación en su propio ADN. Cuando su equipo fue derrotado por el Consorcio Internacional de Secuenciación del Genoma Humano, se duplicó, invirtió más tiempo y esfuerzo y ideó la secuencia presentada en este documento, que tenía un mayor grado de resolución que los esfuerzos anteriores. El documento presenta un argumento a favor del valor de su técnica sobre las técnicas que utiliza el Consorcio Internacional de Secuenciación del Genoma Humano y trata de afirmar la superioridad de su método. Es probable que los datos que se presentan sean fácticos, pero debido a esta historia, debe mirar el documento, los métodos y los motivos detrás de él.

Han pasado solo 15,5 años desde que tuvimos un borrador completo de un Proyecto Genoma Humano producido por el Consorcio Internacional de Secuenciación del Genoma Humano. Para secuenciar ese genoma, se tomaron muestras de unos pocos cientos de individuos. Se secuenciaron pequeños tramos del ADN y luego todas esas piezas se juntaron en una computadora. Eso significa que hubo muchos promedios que sucedieron. Entonces, por defecto, se eligió la base más frecuente en la población de voluntarios en cada posición. Eso significa que eso también debería ser representativo para el resto de la población.

Cuando hacemos declaraciones sobre comparaciones en conjuntos de datos tan grandes como el genoma humano, la mayoría de las veces estamos mirando pequeños subconjuntos conocidos del genoma, y ​​estamos extrapolando mediante métodos estadísticos basados ​​en ese hecho. Una cosa que aprende al leer artículos científicos, y no solo artículos de noticias científicas, es que siempre debe observar sus materiales y métodos para determinar cómo llegaron a sus datos y números de titulares. A menudo se cita que tenemos solo una diferencia del 1,5% entre los humanos y los chimpancés; sin embargo, cuando observa esos documentos, las comparaciones se realizaron solo en áreas de los genomas que se alinearon bien. Eso no quiere decir que no haya un notable grado de similitud entre nosotros y nuestro pariente evolutivo vivo más cercano, es solo que hay más en la historia que el titular.

Además, no tenemos tantos genomas completos secuenciados para compararlos entre sí, como porcentaje de los 8 mil millones de personas que viven hoy. Si bien tenemos representaciones de la mayoría de los grupos étnicos identificados, es posible que nos falten familias con linajes nuevos.

Otra cosa en la que debe pensar es que muchas de las áreas en el genoma humano son repeticiones y elementos estructurales que no codifican genes que afectan la expresión génica. Cosas como los telómeros, que protegen los extremos de los cromosomas, y los centrómeros, que son los puntos de unión en los cromosomas que aseguran que se distribuyan correctamente en las células recién divididas. Estos elementos tienden a permanecer iguales porque las proteínas que se unen a ellos requieren esa especificidad de secuencia para funcionar correctamente, por lo que esas son regiones donde casi todos los ADN serán iguales, y no solo entre humanos. Estos elementos suelen ser muy similares en la mayoría de los vertebrados.

También necesitamos considerar los ARN estructurales. Estas moléculas tienen funciones dentro de la célula que requieren que sus secuencias estén altamente conservadas (sin cambios). Los ARN ribosómicos, los ARN de transferencia y los ARN nucleares pequeños dependen de su secuencia específica para plegarse correctamente a fin de realizar su tarea en la célula. Un solo cambio de base puede cambiar el plegamiento de estos elementos y, como resultado, perderán su función, lo que significa que esas células no podrán producir proteínas adecuadamente, lo que significa que las células morirán. Si esto sucede en las células de la línea germinal, entonces no estarán involucradas en la fertilización, por lo que cualquier mutación se transmitirá.

Podría seguir y seguir, pero lo importante es que no sorprende que haya muy poca diversidad de secuencias en porcentaje dentro de la especie humana, pero también hay muchas advertencias sobre ese hecho.

Editar: ediciones significativas para agregar información relevante y referenciada para respaldar la respuesta.

Quiero crear más cuentas para poder votar más esta respuesta.
@Nathan Agradezco el sentimiento, simplemente me alegro de que lo haya encontrado informativo.
Me gustaría comentar que de los 150 millones de diferencias, solo una pequeña fracción cambia la secuencia de la proteína de manera significativa. Primero, porque las secuencias de codificación de proteínas son el 1,5% del genoma. En segundo lugar, es muy poco probable que un cambio aleatorio de aminoácidos en una proteína tenga un efecto funcional. Tercero, porque los cambios que afectan la función pueden potencialmente ser seleccionados en contra. Entonces, el número real de diferencias funcionales es mucho más pequeño (supongo que ~ 100000 o menos).
@Bitwise Creo que deberías leer ese párrafo nuevamente. No digo que conduzca a 150 millones de cambios, lo digo porque solo un cambio de base puede cambiar una secuencia de aminoácidos, eso puede sumar una diferencia significativa. El punto era que necesitas muy pocas diferencias para llegar a una gran cantidad de variedad entre individuos. Lo que dices sobre el cambio funcional no es del todo correcto. Puede tener una mutación "silenciosa" en un gen, pero si es tal que el tRNA se codifica en un factor de 10 o 100 menos que el tRNA original, entonces puede matar la proteína incluso sin un cambio aa.
@AMR No dije que estuviera equivocado, solo quería aclarar a los lectores que incluso si hay 150 millones de diferencias, solo una fracción muy pequeña es realmente significativa. Consideré las proteínas porque eso es lo que mencionaste, pero hay muchos otros tipos de cambios que pueden ser funcionales (por ejemplo, en las regiones reguladoras). Aún así, incluso si considera todo esto, la gran mayoría de las diferencias no tendrán ningún efecto.
@Bitwise The OP es un estudiante de secundaria que no ha tomado biología. Estoy de acuerdo en que hay muchos más lugares, como promotores y potenciadores, sitios donantes/aceptores de empalme que pueden afectar la funcionalidad, pero como generalmente no enseñamos eso a los estudiantes universitarios de primer año, solo estaba señalando lo que alguien con una comprensión casual puede saber. Su pregunta es desde la perspectiva de que el 0,5% no es mucha variación, usan "solo", y yo estaba tratando de decirles que eso es más que suficiente para proporcionar unicidad a 8 mil millones de personas.
@AMR: Fue hace algún tiempo, pero ¿por qué mencionaría una oración como "También debe comprender que cualquier cambio que sea perjudicial estará bajo una fuerte presión selectiva". después de hablar de cuellos de botella? Después de los cuellos de botella, la selección (ya sea purificadora, positiva o equilibrante) en general es bastante débil y tiene poca eficacia para reducir las variantes deletéreas. Por supuesto, tanto la selección purificadora como la deriva reducen la variación (y, por lo tanto, contribuyen a la baja diversidad genética entre los humanos), pero esto aún podría dar lugar a interpretaciones erróneas...