¿Aparece la cadena "...CATCAT..." en el ADN de Felis catus?

En Gödel, Escher, Bach: An Eternal Golden Braid (GEB) de Hofstadter, aparece la siguiente afirmación:

...en la especie Felis catus , un sondeo profundo ha revelado que, de hecho, es posible leer el fenotipo directamente del genotipo. El lector quizás apreciará mejor este hecho notable después de examinar directamente la siguiente sección típica del ADN de Felis catus :

...CATCATCATCATCATCATCAT...( Nota OP: truncado porque lo entiendes)

¿Es esto cierto? Una búsqueda superficial del ADN de Felis catus me da este artículo de 1996 de López, Cevario y O'Brien y la secuencia dada no aparece: hay algunos casos de "CAT" pero no se repiten lo suficiente como para que sea tan notable como se afirma. en GEB.

No sé suficiente biología para juzgar la veracidad de esta afirmación. Algunos puntos que estoy considerando son:

  • GEB está lleno de juegos de palabras. Sin embargo, el tono de esta parte del texto no me suena.
  • GEB fue escrito/publicado alrededor de 1978. El documento al que me vinculé, que fue citado por otros 236 según Google, se publicó en 1996, mucho después de la época de GEB. Si mi impresión de que el trabajo de Lopez et al. es significativo porque es la primera vez que se secuencia Felis catus , entonces no hay forma de que Hofstadter lo supiera cuando escribió GEB. Por otra parte, no sé lo suficiente de biología como para que pueda haber algunos matices en el artículo de López et al. que me faltan (es decir, los resultados del artículo pueden no ser mutuamente excluyentes con la afirmación hecha en GEB).
  • GEB tiene notas de referencia y bibliografía y no se cita ninguna referencia para respaldar esta afirmación. Sin embargo, GEB no pretende ser una tesis académica rigurosa y las referencias solo se recurren más cuando Hofstadter cita otros trabajos directamente, mientras que la bibliografía es una lista de lecturas que el lector puede querer consultar, con respecto a la tesis principal del libro. .

Entonces, ¿los gatos son recursiones sin casos base?

¡Bienvenido a BiologíaSE! ¡Llegaste con una explosión! ;)
Como regla general: cuando encuentre postulados asombrosos científicamente impresionantes en GEB, es mejor que se asegure de haberlos detectado en uno de los diálogos en lugar del material principal. Los personajes del diálogo de Hofstadter tienden a tomarse una cantidad considerable de libertad poética con la ciencia subyacente. No sé en qué sección encontraste esto, pero la afirmación de que el fenotipo es deducible del genotipo suena mucho como tener más ironía de lo que un gato promedio podría esperar.
¿El ADN de Lady Gaga tiene GAGAGA?
Si bien no conozco el genoma del gato, estoy bastante seguro de que el genoma del perro no contiene DOG.
Voto para cerrar esta pregunta como fuera de tema porque, por divertido que sea, pero la relación entre la palabra inglesa cat y las abreviaturas utilizadas para las moléculas no pueden considerarse de ninguna manera relacionadas con la biología. Quizá tenga algo que ver con la estadística o la literatura inglesa.
Voto para cerrar esta pregunta porque es trivial y estúpido.
Voto para cerrar esta pregunta porque, como @David ha señalado en el pasado, esta pregunta es trivial y no tiene relevancia biológica.
@tyersome Sin embargo, ha sido votado a favor al menos 92 veces y favorito 22 veces.
Voto para cerrar esta pregunta porque no tiene ningún interés científico.
Interesante. Ahora veo que tanto @tyrsome como yo votamos para cerrar esto anteriormente. ¿Por qué se eliminaron nuestros votos para cerrar?
@David Bcoz nadie más lo apoyó y sus votos envejecieron . Envejecen después de 14 días.
@user237650 — Gracias por la información. Bueno, al menos los comentarios no.

Respuestas (4)

El genoma de Felis catus se ha publicado, anotado y actualizado bastante desde 1996, incluidos tramos de las llamadas regiones intergénicas, que son básicamente andamios y otras estructuras, junto con quizás algunos genes no identificados, pseudogenes, secuencias reguladoras, etc. Básicamente , prácticamente toda la secuencia de ADN está disponible ahora, no solo la secuencia genética del genoma mitocondrial , que fue lo que se publicó en el artículo de 1996 al que hace referencia. Las mitocondrias son las plantas de energía de la célula, pero son solo un orgánulo que contiene su propio ADN; están separados de los cromosómicos.ADN en el núcleo. Todo esto está disponible de forma gratuita (si sabe dónde buscar) en el Centro Nacional de Información Biotecnológica (NCBI), parte de la Biblioteca Nacional de Medicina (NLM) en los Institutos Nacionales de Salud (NIH) en los Estados Unidos. También hay otros sitios disponibles, como Ensembl , un proyecto conjunto entre el Instituto Europeo de Bioinformática (EMBL-EBI), parte del Laboratorio Europeo de Biología Molecular (EMBL), y el Instituto Wellcome Trust Sanger (WTSI). Ambos institutos están ubicados en el Campus Wellcome Trust Genome en el Reino Unido.

Entonces, al genoma. Las secuencias genómicas se pueden buscar de dos maneras diferentes, según lo que esté buscando, pero la forma más común es usar BLAST, la herramienta de búsqueda y alineación local básica. Como su nombre lo indica, toma secuencias como entrada y busca una contra la otra, alineando los resultados lo mejor posible utilizando ciertos algoritmos que el usuario puede definir y modificar. La interfaz web de BLAST para el genoma del gato está aquí . No necesita preocuparse por ninguna de las otras opciones aquí, excepto el cuadro "Ingresar secuencia de consulta". El formato FASTA solo usa las abreviaturas de una sola letra para nucleótidos (AGCT), todas encadenadas.

El genoma que estamos buscando es el de un gato abisinio llamado Cinnamon:

Canela

Cinnamon, el gato elegido para ser el modelo genético definitivo para todos los gatos en el proyecto del genoma felino. Imagen cortesía de la Facultad de Medicina Veterinaria de la Universidad de Missouri .

Para empezar, escribí CATCATCATCATy, para mi sorpresa, obtuve más de 200 resultados, cubriendo todos los cromosomas que tiene el gato. Entonces, dupliqué la longitud de la entrada a 8 CATs y obtuve el mismo conjunto de resultados. Desafortunadamente, 12 CATs fueron demasiados (y realmente, son demasiados), así que trabajé al revés.

Los resultados finales están aquí (lo siento, el enlace vence el 13/10/16. Para regenerar, vaya al enlace BLAST arriba e ingrese CATCATCATCATCATCATCATCATCATCAT). Aparentemente, la sabiduría popular es incorrecta, y los cromosomas de Felis catus realmente contienen 10 CATs cada uno, uno más de lo que se necesita para sus 9 vidas. Aún no se sabe por qué puede ser esto, pero presumiblemente los científicos están trabajando en ello.

La ironía podría tomarse en serio, no creo que sea un buen lugar para bromear.
@har-wradim, ¿qué es irónico aquí? ¿La última oración? No hay problema, ya que no estoy interesado en una investigación profunda sobre los gatos, per se. Encuentro la respuesta bien detallada y, aunque mi conocimiento de biología es limitado, la explicación de Matt se suma, es reproducible y verificable. Bueno, la interfaz de usuario de NCBI Blast no tiene la calidad de Apple, pero se mantiene hasta donde puedo interpretarlo.
Mi pregunta es, ¿felis catus es la única especie para la que esto es cierto? Supondría lo contrario.
@Jan: Yo diría que es muy poco probable. Esto es solo una coincidencia de patrones con un conjunto de entradas astronómicas.
@JanDvorak, ¿puedes pensar en un animal escrito con A, T, C y G?
EL MOAR QUE CONOCES: Se rumorea que una conocida cantante pop tiene mucho "GAGA" en su ADN. En otras noticias: todas las demás formas de vida basadas en el carbono también lo hacen.
Escuché que todo el elenco de Gattaca tenía secuencias GATTACA en su ADN. La mayoría de la tripulación lo hizo. Huelo una conspiración. Creo que incluso aprobaron una ley sobre grandes números para encubrirlo.
Mi formación es en matemáticas; Me uní a Biology StackExchange para dejar este comentario. El genoma del gato, como el nuestro, tiene una longitud de unos 3.000 millones de pares de bases. La probabilidad de hacer coincidir una secuencia de n pares de bases que comiencen en cualquier posición dada es de 1 en 4^n (ya que hay 4 pares de bases posibles), que para n=12 es aproximadamente 1 en 16 millones. Eso significa que esperaría encontrar alrededor de 200 coincidencias para CATCATCATCAT si todas las secuencias cortas fueran igualmente probables. Esto no será del todo cierto, pero como señala March, la existencia generalizada de repeticiones en tándem hace que los partidos como este sean aún más probables.
Leyendo muchos de los comentarios de esta página, tengo la sensación de que mientras unos aquí nos divertimos, otros, menos informados, están completamente confundidos. Mi voto va para @March Ho.
@ har-wradim, ¿qué significa exactamente eso?
@ har-wradim no importa, ya veo. Algunas personas se han perdido por completo la broma y se lo están tomando demasiado en serio.
@skytreader "La interfaz de usuario de NCBI Blast no tiene la calidad de Apple, pero...", ¿lo que significa que no puede buscar los genomas de las manzanas? o.. ?
@DaniloRamirez Apple como de donde vienen las Macbooks. Muchas herramientas científicas, incluso productos de la industria, tienen interfaces de usuario que no son de la calidad de Apple pero que, sin embargo, son útiles y potentes.
Aprecio mucho el humor al final allí :)
@skytreader Oh, esa Apple... por favor no... :) el juego de palabras tenía la intención del comentario inicial, pero gracias por mantenerlo muy explicativo
@MattDMo Entonces, lo entiendo correctamente, ¿podría haber algún otro gato diferente de Cinnamon que pueda tener más CATCATCAT ... que ella? Porque solo analizamos un genotipo y los de otros organismos de la misma especie pueden diferir, ¿no?
@nuoritoveri Sí, eso es posible.
Creo que este es el más largo ncbi.nlm.nih.gov/nucore/… ( C A T ) 41 (complementado al revés) ¿tal vez olvidó desmarcar 'enmascarar regiones de baja complejidad'?

Si bien la respuesta de Matt es perfectamente correcta, es importante señalar que la secuencia ( C A T ) norte en el ADN no se limita a los gatos, y esperaría encontrarlo en cualquier parte.

Por ejemplo, la búsqueda en el genoma humano de la misma secuencia repetida de 3 tándem CATtambién da como resultado muchos resultados.

Esto se debe a que básicamente está buscando repeticiones cortas en tándem en la cadena de ADN. Estas repeticiones pueden ocurrir en cualquier organismo y, por lo tanto, aunque encontrar CATsubcadenas en el ADN del gato puede ser divertido, no son especiales para los gatos (o cualquier otro animal) y son solo el resultado de un artefacto de nombrar las bases por coincidencia. a juego con el nombre del animal.

Las bases no son simplemente 'nombradas', representan las cuatro bases nitrogenadas: adenina, citosina, guanina y timina.
@SummerEla Si bien tiene razón, no veo cómo es inexacto llamar a eso "nombrar".
Bueno, es más como un acrónimo que un sistema de nombres: esos tres nucleótidos juntos (llamados codón) finalmente trabajan juntos en cadenas de codones para codificar una proteína específica.
@SummerEla Si las bases se llamaran adenina, bytosina, cuanina y dymine, entonces tendrías BADBADBAD. Si se llamaran qurine, quadrium, quitterium y quinterone, entonces tendrías QQQQQQQQQ. Y así. Al cambiarles el nombre, puede inventar cualquier palabra corta que contenga solo cuatro letras diferentes y encontrarla en cualquier cromosoma de cualquier animal que desee; por ejemplo, podría hacer que el cromosoma Y humano contenga "MENS".
@immibis que? Mi punto era que las bases no se nombran arbitrariamente, en realidad representan nucleótidos que comprenden aminoácidos, que cuando se combinan forman proteínas.
Pero la denominación de los propios nucleótidos es, en última instancia, arbitraria. Según etymonline.com , la adenina se "llama así porque se derivó del páncreas de un buey", mientras que la guanina se nombra "del guano, del cual se aisló primero el químico" y la timina "del ácido tímico, del cual se aislado" (citosina proviene de cito- que significa "célula"). Si los descubrimientos hubieran ocurrido de manera diferente, esos productos químicos tendrían nombres muy diferentes.
HAHAHA (no, no es una secuencia de nucleótidos reasignada/renombrada, realmente riendo). Por alguna razón, esto hace más divertido el reclamo del GEB. ¡Gracias por la aclaración!
@SummerEla Bueno, sí, cuando la secuencia "citosina, adenina, timina" codifica algo en particular. Lo mismo ocurre con la secuencia "quadrium, qurine, quinterone" porque en realidad son la misma secuencia, solo estoy usando diferentes nombres para referirme a las mismas bases.
@SummerEla También lo hace "timina, adenina, citosina" en una línea de tiempo alternativa donde la palabra "timina" se refiere a la base con un anillo y un subgrupo NH2, y "citosina" se refiere a la base con un anillo y sin subgrupo NH2.
@SummerEla Además, estoy bastante seguro de que los nucleótidos no comprenden aminoácidos, solo codifican para ellos.
@RobinSaunders ¿Guano? ¿Quieres decir que una cuarta parte de nuestro ADN lleva el nombre de mierda de murciélago? Siento que eso debería sorprenderme más.
Entonces, según la respuesta de Matt (que hay una secuencia 10x), ¿se puede encontrar esa secuencia 10x en otros organismos?

Para aumentar las otras respuestas, calculemos la probabilidad de que CATCATCATCAT ocurra en una secuencia aleatoria de ADN.

La longitud del ADN del gato es de 2,7 gigabases ( fuente ), y hay 4 bases posibles. Para 1 CAT hay 3 bases, dando el número esperado de ocurrencias en 2.7 Gb como 2.7 10 9 4 3 42 188 000

Repitiendo el cálculo para secuencias más largas se obtiene:

  • 1 CAT: 42 188 000 ocurrencias
  • 2 CAT: 659 180 ocurrencias
  • 3 CAT: 10 300 ocurrencias
  • 4 CAT: 160 ocurrencias
  • 5 CAT: 2 ocurrencias
  • 6 CAT: 0 ocurrencias

Entonces, de hecho, hay muchos más CAT en los gatos de los que cabría esperar por pura casualidad.

No sería demasiado sorprendente que las secuencias repetidas fueran más probables que la mayoría de las secuencias.
El ADN no es una secuencia aleatoria tan simple y, en particular, las repeticiones ocurren por encima de lo probable. Por lo tanto, este no es un buen enfoque.
@JackAidley En mi opinión, este es un buen enfoque para demostrar exactamente que las repeticiones ocurren con más frecuencia que en una secuencia aleatoria.
@jba: Lo hace. Pero no hay nada especial en la secuencia 'CAT' en el genoma del gato. Es una propiedad general de las repeticiones. ¿Quizás podría editar su respuesta para dejar en claro el punto que está señalando y por qué?
Al interpretar el número esperado de ocurrencias como un parámetro de Poisson, puede interpretar las ocurrencias de 6 CAT como una probabilidad (a través de la transformada λ 1 Exp ( λ ) ) de alrededor del 4% que tendría esa cantidad en una secuencia aleatoria. Como señala jpa, este es un buen argumento de que los STR como CATCAT... son más probables de lo que sugeriría la casualidad.
Más bien, es un argumento de que las secuencias de ADN no son aleatorias en la forma en que supone este cálculo.
@reinierpost es aleatorio desde el punto de vista de CAT. El significado que atribuimos a CAT es arbitrario para el ADN. Es tan aleatorio como el índice en el número Pi en el que tienes que empezar para encontrar un video de gatos.
@CandiedOrange: Eso no es lo que esta respuesta significa con 'aleatorio'. Asume que los elementos C, A, T y G son completamente aleatorios en el sentido de que la probabilidad de que uno de ellos aparezca en un punto específico de la secuencia es completamente independiente de cuáles son los elementos circundantes en la secuencia, y eso no es así. el caso.
@reinierpost esas dos ideas de aleatorio son la misma idea de aleatorio es mi punto.

Entonces, ya hay algunas respuestas excelentes aquí, pero parece que nadie abordó una parte interesante de su pregunta: GEB se publicó en 1978 y el genoma de Felis catus no se secuenció hasta muchos años después... Entonces, ¿cómo lo supo?

La respuesta de jpa muestra que esperaría obtener solo unos cinco CAT, no diez, y la posibilidad de obtener diez es astronómicamente baja. Amplié su tabla para mostrar la probabilidad deprimentemente baja de obtener diez por aleatoriedad perfecta:

5 CAT: 2.5 expected per Felis catus genome
6 CAT: 0.04 expected
7 CAT: 0.00061
8 CAT: 9.54 e-6
9 CAT: 1.49 e-7
10 CAT: 2.32 e-9

Eso significa que esperaría encontrar 10 CAT aproximadamente 0,00000000232 veces por genoma aleatorio. Entonces, ¿cómo diablos el genoma de Felis catus terminó con diez CAT? ¿Y cómo supo Hofstadter que habría tantos CAT?

Resulta que esta secuencia repetida de unos pocos pares de bases se denomina "repetición corta en tándem" o "microsatélite". Esto es cuando una secuencia de 2-5 pares de bases se repite varias veces, generalmente entre 5 y 50 veces.

Entonces, en este punto, para recapitular: sabemos que la posibilidad de obtener esta secuencia 10 CAT es un poco más probable, pero dado que estamos restringidos solo al genoma de Felix catus, definitivamente no tenemos garantizada una secuencia 10xCAT. Entonces, ¿cómo lo declaró Hofstadter como si fuera un hecho?

Resulta que una propiedad crítica de los STR, o repeticiones cortas en tándem, es que las mutaciones en estas áreas son mucho más comunes y representan una gran cantidad de la variación genética entre los miembros individuales de una especie. Este descubrimiento se hizo con el advenimiento de la secuenciación del ADN, que comenzó solo unos años antes de que se publicara el libro. Por lo tanto, dada una gran población de gatos no idénticos (que tenemos), podemos decir con confianza que existe una posibilidad extremadamente alta de una secuencia 10xCAT.

El genio de Hofstadter combinó a la perfección las matemáticas (solo 2,32e-9 secuencias esperadas por genoma) con la biología (los microsatélites aumentan las posibilidades de encontrar esta secuencia) con la genética forense (en una población de la misma especie, es probable que los individuos tengan muchas diferencias relacionadas con STR .) Todo esto junto le dio a Hofstadter lo que necesitaba para decir con confianza: sí, CATCATCATCATCATCATCATCATCATCAT casi con seguridad existe en el ADN de Felis catus. Pequeñas cosas como esta son la razón por la que Godel, Escher, Bach es mi libro favorito de todos los tiempos.