¿Los humanos comparten el 50% de su ADN con los plátanos?

Se afirma ampliamente que compartimos el 50% de nuestro ADN con los plátanos. ¿Tiene esto una base real o es un mito?

Ejemplos de reclamaciones The Mirror (Reino Unido) , NHGRI

Respuestas (2)

Finalmente, una pregunta que cubre mi área nominal de especialización. Para responder a esta pregunta de manera significativa, necesitaremos definir algunos conceptos, pero primero.

Sí, algo así. La declaración es objetivamente correcta para interpretaciones razonables.

Entonces, a los términos.

Voy a vincular a un stackexchange más específico para apoyar las definiciones

Homología.

Para hacer una analogía: si alguien dijera "los humanos comparten el 90% de su esqueleto con las aves", ¿sería una afirmación razonable? la estructura general es la misma, la mayoría de los huesos tienen un equivalente que es más largo, más corto, más grueso y más delgado. Los huesos pueden tener adaptaciones para la fuerza o el peso, pero estira y aplasta las cosas un poco y obtendrás algo que se ve igual.

homología

Ortología

Los ortólogos son genes en diferentes especies que evolucionaron a partir de un ancestro común. Los ortólogos normalmente conservan la misma función.

Paralogía

Los parálogos son genes que han sido duplicados. Una copia puede terminar haciendo algo muy diferente al original, pero conserva algunas cosas en común.ingrese la descripción de la imagen aquí

¿Cuándo 2 genes cuentan como lo mismo?

Veamos un ejemplo

Histona H1

La histona se encuentra en la mayoría de las especies y está muy conservada. No es idéntico en todas las especies, pero es casi lo mismo.

histona

De hecho , muchos de los genes que necesitamos para vivir son comunes a muchas especies . Genes para copiar ADN, genes para reparar paredes celulares, genes para controlar la temperatura, genes para metabolizar varios azúcares . No importa si eres un humano o una planta de banano, necesitas mucha de la misma maquinaria básica para vivir.

Los genes no son perfectamente idénticos, pero dado que en su mayoría tienen que hacer el mismo trabajo y es probable que mueras o no te reproduzcas sin ellos, tienden a estar muy conservados, y la mayoría de las diferencias se encuentran en puntos menos importantes de los genes.

Los genes se mueven, se voltean de atrás para adelante o intercambian cromosomas o los cromosomas se fusionan o dividen, pero generalmente están ahí en alguna parte.

Por ejemplo, aquí hay un genoma de ratón coloreado por las secciones que tienen homólogos en el genoma humano.

genoma del ratón

Se trata de cuán estricto eres con lo que consideras ADN "compartido".

Si cuentas las secuencias de genes con una sola base diferente como diferente, entonces la mayoría de los humanos no contarían como muy similares a otros humanos.

Si permite 1, 2, 3, 4 o más mutaciones por 100 bases mientras sigue contando algo como "lo mismo", entonces puede obtener casi cualquier porcentaje que desee.

Es por eso que dije "más o menos" arriba.

Podría vincular a algún documento donde dan algún número, pero eso no sería terriblemente informativo. Podría señalar 3 más que dan diferentes números para lo mismo porque se trata de dónde estableces los puntos de corte al decidir si algo cuenta como lo mismo.

Esta es una muy buena respuesta: es informativa, referenciada y explica bien el tema. Algunas personas notarán que les gusta, ya que no es realmente el formato habitual (uno o dos documentos que hacen referencia al tema), pero aún así me gusta. +1 de mi parte!
Ese diagrama que muestra de los homólogos de ratón/humano codificados por colores; ¿Ese tipo de diagrama tiene un nombre?
Oh, espera, no importa; cinteny.cchmc.org los genera y parece referirse a ellos como "synteny maps". Lamentablemente, no tienen plátanos en su base de datos, pero sí tienen arroz. Hice esto , pero no estoy seguro de qué parámetros usaron para generar el ratón/humano.
Sí, eso suena bien. Con especies muy lejanamente relacionadas, debe limitarlo a los exones y aceptar muchos más desajustes para obtener un grado razonable de synteny. Al revisar su diagrama/mapa de sintenia humano-ratón, parece que tienen parámetros predeterminados un poco más estrictos que los que se usaron para generar el diagrama que incluí en mi publicación.
Tengo curiosidad: ¿qué pasa con el ADN no genético ? Gran parte del ADN en realidad no contiene ningún gen. Entonces, ¿cuánta variación hay en esas piezas de ADN entre especies? ¿Son muy variables o estables?
@Bakuriu ¿No genético? ¿Te refieres a no codificar? intrones? ¿Secciones no sometidas a presión selectiva? algunas áreas de nuestro ADN no parecen estar bajo presión selectiva, las mutaciones/cambios en esas áreas no se seleccionan de la población, lo que sugiere que si están haciendo algo, su secuencia real no es importante hasta el punto de tener un efecto sobre la probabilidad de que un individuo sobreviva. Tiende a haber diferencias masivas en esas áreas incluso entre individuos de la misma especie.
¿No sería mejor expresar esta respuesta como "los humanos comparten el 50% de los genes con los plátanos"? Del mapa de sintenia con arroz, está bastante claro que la afirmación del "50% de ADN" es falsa.
@MarchHo, lamentablemente, las poblaciones y los medios mal informados intercambiarán fácilmente palabras y realmente estropearán las cosas. He oído hablar de personas que usan los dos términos indistintamente...
Usted dice que esto es cierto bajo "interpretaciones razonables", pero luego no ofrece tal interpretación. Sí, hay muchas formas de medir el porcentaje de ADN compartido entre dos especies. Pero, ¿hay alguna forma sensata de que salga al 50%? Ni siquiera tratas de mostrar que hay, aquí.
¿Ese gráfico de homología ratón/humano indica que no se encuentran genes en el cromosoma Y humano en el cromosoma Y del ratón? ¿Por qué es eso, considerando todas las otras superposiciones?

La afirmación de que compartimos el 50% de nuestro ADN es probablemente una cita errónea de una afirmación más antigua, que compartimos el 50% de nuestros genes con las bananas. Ambas afirmaciones, hasta donde puedo decir, son falsas. Abordaré cada reclamo a su vez.

¿El 50% de nuestro ADN ?

La idea de que compartimos el 50% de nuestro ADN es, según las definiciones más obvias de lo que eso podría significar, completamente falsa y trivialmente. Según Wikipedia , el genoma humano tiene una longitud aproximada de 3 giga pares de bases. El genoma del banano ( Musa acuminata ), por otro lado, tiene solo alrededor de una quinta parte de esa longitud: 600 Mb según ProMusa , o solo 520 Mb según la primera publicación de un genoma de referencia en 2012 .

Claramente, entonces, no podemos alinear rebanadas de una sola copia del genoma del banano contra el genoma humano y hacer que cubran el 50% de su longitud, ¡porque ni siquiera hay suficientes pares de bases para que esto sea posible!

¿De dónde, entonces, surge esta afirmación? El bioinformático Neil Saunders trató de rastrear la respuesta y escribió sus hallazgos en una publicación de blog titulada 50% bananas ; la fuente más antigua que puede encontrar es esta entrevista con Steve Jones en el episodio Casi como una ballena de The Science Show en la radio ABC el 12 de enero de 2002), una década antes de la publicación del primer genoma del banano.

Steve no corrobora la afirmación en la entrevista, y se presenta en el contexto de una broma sobre cómo los organismos genómicamente similares pueden ser muy diferentes entre sí:

... también compartimos alrededor del 50% de nuestro ADN con las bananas y eso no nos convierte en medias bananas, ni de cintura para arriba ni de cintura para abajo. Entonces, hay límites en lo que la genética puede decirnos sobre lo que significa ser humano...

Es más, un poco antes de esta entrevista, otras fuentes afirmaban que compartimos el 50% de nuestros genes con los plátanos. Aquí hay una fuente para esa afirmación de abril de 2001: https://www.pbs.org/wgbh/nova/genome/deco_lander.html *. Por lo tanto, si bien no podemos estar seguros de cuál fue la base de Steve, podemos especular que simplemente citó erróneamente esa afirmación similar, en el curso de una broma en una entrevista de radio.

Pero, ¿qué pasa con ese reclamo alternativo, entonces?


50% de nuestros genes ?

La respuesta de Murphy sugiere que es razonable tomar la afirmación de que "compartimos el 50% de nuestro ADN" con los plátanos en el sentido de que el 50% de las decenas de miles de genes humanos tienen homólogos en los genes del plátano. Es más, la fuente más antigua que puedo rastrear para cualquier variante de la afirmación "50% banana" - la entrevista de 2001 previamente vinculada con el Dr. Eric Lander , en la que el entrevistador , el periodista científico Robert Krulwich, lo menciona - dice que compartimos El 50% de nuestros genes, no el 50% de nuestro ADN. Entonces, ¿es cierta esta variante de la afirmación?

Lo mejor que puedo decir, no. Como mínimo, es dudoso y no puedo encontrar ninguna justificación para ello.

Como se señaló anteriormente, el genoma del banano no se secuenció hasta 2012, pero esta afirmación se remonta al menos a 2001, por lo que se hizo sin acceso a los datos que ahora tenemos. Y Neil Saunders, en su publicación de blog "50% bananas", intentó usar Orthologous Matrix Browser , una herramienta pública para encontrar ortólogos de genes, para buscar ortólogos de genes humanos en el genoma de las bananas. Él informa que solo encuentra alrededor de 3500 genes humanos con tales ortólogos. (Específicamente, 3440: obtengo un número ligeramente diferente, quizás debido a cambios en el algoritmo de la OMB).

Puede replicar el resultado de Neil usted mismo ingresando HUMAN y MUSAM (correspondiente a Musa acuminata , el nombre científico de los plátanos) en https://omabrowser.org/oma/genomePW/ y haciendo clic en "obtener pares". El OMB devuelve un TSV de pares de ortólogos, con la identificación de un gen humano a la izquierda y su gen de plátano correspondiente a la derecha. Como señala Neil, si contamos el número de ID de genes humanos únicos enumerados, obtenemos el número total de genes humanos que el algoritmo de OMB cree que tienen al menos un ortólogo en el genoma del banano. Tal conteo se muestra a continuación en Python:

>>> import requests
>>> result_tsv = requests.get('https://omabrowser.org/cgi-bin/gateway.pl?f=PairwiseOrthologs&p1=HUMAN&p2=MUSAM&p3=OMA').text
>>> unique_human_gene_names = {line.split('\t')[0] for line in result_tsv.splitlines()}
>>> len(unique_human_gene_names)
3484

Señala que esto,

dado que hay veinte mil genes de codificación de proteínas humanas, equivale a alrededor de "17% de plátano".

Por supuesto, la OMB solo está usando un algoritmo para intentar encontrar ortólogos al observar secuencias de referencia. Puede haber algún enfoque alternativo defendible que arroje un resultado diferente. Pero si es así, no he podido encontrarlo; el único intento que conozco de verificar la afirmación del 50% a la luz de los genomas de referencia publicados es el de Neil, y su método, al menos, encuentra claramente que la afirmación es falsa.


* Le envié un correo electrónico al profesor Lander para ver si recordaba la fuente original de la que escuchó el reclamo. Por desgracia, no lo hace. Especuló que podrían ser familias de genes a las que se refería originalmente la afirmación, en lugar de genes.

"un resultado que puede confirmar trivialmente" Es trivial ejecutar su código. No es trivial confirmar que su código hace algo significativo, o que los datos obtenidos son significativos.
@Oddthinking Si no confía en ese código en particular (o en mí, o en la fuente citada), simplemente cuente los genes únicos de alguna otra manera. Todo lo que hace es contar la cantidad de elementos únicos en una columna de un TSV. Estoy de acuerdo en que confirmar que los datos obtenidos son significativos es un problema más complicado.
Contar los elementos únicos en una columna de un TSV es trivial (para un desarrollador de Python). Pero no ha demostrado que contar elementos únicos en esa columna sea una forma significativa de contar genes, y hacerlo no debe descartarse con un "trivial" agitado con la mano.
@Oddthinking Esa es una crítica razonable. Modificaré la respuesta para proporcionar más justificación para el método.
@Oddthinking Modifiqué un poco la publicación a la luz de tus críticas. En particular, he hecho dos cosas: he desarrollado un poco mi explicación del enfoque del conteo de ortólogos, y he suavizado un poco la afirmación de que la variante del "50% de los genes" de la afirmación es falsa (ya que todo lo que realmente puedo decir defendiblemente es que el algoritmo de OMB que intenta identificar ortólogos produce un resultado muy diferente; no sé si no hay una metodología defendible que produzca un resultado diferente).