¿Por qué Nature usa un sistema de 4 niveles para codificar información en el ADN?

Question

¿Por qué Nature usa un sistema de 4 niveles para codificar información en el ADN?

adn
Biología
uso de codones
Teoría de la información
genética molecular

mario kren

Primero, no soy biólogo, por lo que esta pregunta podría ser ingenua:

El procesamiento y almacenamiento de información por computadora se basa en un sistema de bits de 2 dígitos con valores 0 y 1. Ahora, el ADN almacena la información en un sistema de 4 dígitos: A, C, G, T. Tres pares de bases forman un codón y pueden codificar 4 ³ aminoácidos.

¿Hay alguna buena razón por la que un sistema de 4 niveles (que puede almacenar 2 bits por entidad de codificación) evolucionó en lugar de un sistema de 2 niveles o un sistema con una mayor cantidad de símbolos en el alfabeto?

Dicho de otra manera: ¿Por qué no se prefirió un sistema binario para el almacenamiento y procesamiento de datos? En computación, el sistema binario es mucho más fácil, y las pocas pruebas de procesamiento de datos exóticos de alto nivel no han tenido éxito.

mario kren

A un nivel abstracto, ambos sistemas realizan almacenamiento y procesamiento de información. Mi pregunta no era si los organismos vivos son computadoras, sino por qué, en el nivel abstracto de información, por qué se ha favorecido un sistema de codificación de 4 niveles. Su comentario parece no ser constructivo, pero tal vez no entendí algo.

roland

¿Por que no? No hay ningún inconveniente inherente en un sistema de base 4 en lugar de uno de base 2. En ausencia de presión de selección, la evolución precisa del sistema puede ser solo una coincidencia.

canadiense

Es una pregunta interesante pero dudo que tenga respuesta, solo hipótesis. Este papel puede interesarle.

mario kren

@Roland, ¿cómo sabes que no hubo presión de selección? No me puedo imaginar que este fuera el primer y único sistema que se desarrolló. Mirando la complejidad, no puedo creer que no hubiera pasos previos de sistemas de codificación de información más primitivos, y no más de uno de esos sistemas compitiendo.

mario kren

@canadianer gracias por este artículo, ¡se ve genial! por lo que veo, ya comienzan con lógica 4-nary. ¡pero la estructura de la codificación de información, usando dos nb por codón es genial!

roland

Bueno, realmente no tenemos forma de saberlo, pero por mi parte no puedo imaginar cuál sería la presión de selección a favor de un sistema binario. ¿Puede dar un ejemplo? En todo caso, dado que un sistema de base 4 transportaba más información por base, parece más económico. Pero supongo que la química era mucho más importante que todo esto.

WYSIWYG

La pregunta básica quizás sea, "¿por qué el ADN tiene 4 bases?". Luego viene "por qué usar tres para un codón". En cualquier caso, las respuestas solo pueden ser especulaciones.

mario kren

@Roland como físico solo puedo especular, por lo que podría ser ingenuo; pero, por supuesto, puedo ver las razones que favorecen los sistemas binarios (la lógica involucrada es mucho más fácil, por lo que la corrección de errores podría ser mucho más fácil; tal vez solo con binario, hay un sistema químico más simple para codificar información, que podría ser significativamente más pequeño/más robusto que el ADN) ; o sistemas de nivel superior (más información en menos operadores, por lo que el código puede ser mucho más pequeño). Estoy seguro de que hubo científicos biológicos reales que hicieron esas preguntas y propusieron diferentes hipótesis interesantes. Eso es lo que estoy buscando :-)

perry

Mi comprensión del contenido de la información y la capacidad de codificación es que un solo sitio de nucleótido puede contener un máximo de 2 bits de información y, por lo tanto, un triplete de codones puede contener un máximo de 6 bits de información. ¿Dónde entró la base 4? Puede encontrar interesante y relevante leer el tratamiento de Tom D Schneider de la eficiencia del ~ 70% del código genético.

mario kren

@mdperry Si un nb lleva 2 bits de información, es (al menos) un sistema de 4 niveles. los 4 niveles en el ADN son A,C,G,T. ¿Leíste mi pregunta?

perry

Cuando dices 'un nb', ¿es una abreviatura de 'base de nucleótidos'? La abreviatura común es 'nt' para 'nucleótido'. Al leer este hilo, veo que algunas personas usan 'base' como en nb o nt, pero algunas publicaciones usan 'base' para un sistema de conteo, por lo que la base 2 es binaria, la base 10 es decimal. Ignoro el término que usa '4 niveles' o '2 niveles' para el caso. Probablemente estaba confundido.

Potencial de inacción

"Todo nuestro procesamiento y almacenamiento de información se basa en una lógica de 2 niveles, bits con 0 y 1". Se da por hecho que se trata de una construcción orgánica de larga data, pero está íntimamente relacionada con los mecanismos por los que funcionan las computadoras. La transmisión de datos y cálculos mediante computadoras se basa en circuitos que emiten señales de alto o bajo voltaje en función de los voltajes de sus entradas. Debido a que el voltaje exacto puede variar significativamente de un sistema a otro y de un circuito a otro, la fidelidad se mantiene al diferenciar solo entre voltaje alto y voltaje bajo (encendido y apagado o 1 y 0).

rus9384

Yo diría que en las computadoras modernas el sistema no es en realidad solo binario. Dado que las palabras tienen una longitud de 32/64 bits, la base se puede ver como 2 ^ 32 o 2 ^ 64 (si hacemos el paralelo con la codificación del ADN). Pero al menos la base es 256 (byte).

Respuestas (3)

¿Por qué Nature usa un sistema de 4 niveles para codificar información en el ADN?

A un nivel abstracto, ambos sistemas realizan almacenamiento y procesamiento de información. Mi pregunta no era si los organismos vivos son computadoras, sino por qué, en el nivel abstracto de información, por qué se ha favorecido un sistema de codificación de 4 niveles. Su comentario parece no ser constructivo, pero tal vez no entendí algo.
¿Por que no? No hay ningún inconveniente inherente en un sistema de base 4 en lugar de uno de base 2. En ausencia de presión de selección, la evolución precisa del sistema puede ser solo una coincidencia.
Es una pregunta interesante pero dudo que tenga respuesta, solo hipótesis. Este papel puede interesarle.
@Roland, ¿cómo sabes que no hubo presión de selección? No me puedo imaginar que este fuera el primer y único sistema que se desarrolló. Mirando la complejidad, no puedo creer que no hubiera pasos previos de sistemas de codificación de información más primitivos, y no más de uno de esos sistemas compitiendo.
@canadianer gracias por este artículo, ¡se ve genial! por lo que veo, ya comienzan con lógica 4-nary. ¡pero la estructura de la codificación de información, usando dos nb por codón es genial!
Bueno, realmente no tenemos forma de saberlo, pero por mi parte no puedo imaginar cuál sería la presión de selección a favor de un sistema binario. ¿Puede dar un ejemplo? En todo caso, dado que un sistema de base 4 transportaba más información por base, parece más económico. Pero supongo que la química era mucho más importante que todo esto.
La pregunta básica quizás sea, "¿por qué el ADN tiene 4 bases?". Luego viene "por qué usar tres para un codón". En cualquier caso, las respuestas solo pueden ser especulaciones.
@Roland como físico solo puedo especular, por lo que podría ser ingenuo; pero, por supuesto, puedo ver las razones que favorecen los sistemas binarios (la lógica involucrada es mucho más fácil, por lo que la corrección de errores podría ser mucho más fácil; tal vez solo con binario, hay un sistema químico más simple para codificar información, que podría ser significativamente más pequeño/más robusto que el ADN) ; o sistemas de nivel superior (más información en menos operadores, por lo que el código puede ser mucho más pequeño). Estoy seguro de que hubo científicos biológicos reales que hicieron esas preguntas y propusieron diferentes hipótesis interesantes. Eso es lo que estoy buscando :-)
Mi comprensión del contenido de la información y la capacidad de codificación es que un solo sitio de nucleótido puede contener un máximo de 2 bits de información y, por lo tanto, un triplete de codones puede contener un máximo de 6 bits de información. ¿Dónde entró la base 4? Puede encontrar interesante y relevante leer el tratamiento de Tom D Schneider de la eficiencia del ~ 70% del código genético.
@mdperry Si un nb lleva 2 bits de información, es (al menos) un sistema de 4 niveles. los 4 niveles en el ADN son A,C,G,T. ¿Leíste mi pregunta?
Cuando dices 'un nb', ¿es una abreviatura de 'base de nucleótidos'? La abreviatura común es 'nt' para 'nucleótido'. Al leer este hilo, veo que algunas personas usan 'base' como en nb o nt, pero algunas publicaciones usan 'base' para un sistema de conteo, por lo que la base 2 es binaria, la base 10 es decimal. Ignoro el término que usa '4 niveles' o '2 niveles' para el caso. Probablemente estaba confundido.
"Todo nuestro procesamiento y almacenamiento de información se basa en una lógica de 2 niveles, bits con 0 y 1". Se da por hecho que se trata de una construcción orgánica de larga data, pero está íntimamente relacionada con los mecanismos por los que funcionan las computadoras. La transmisión de datos y cálculos mediante computadoras se basa en circuitos que emiten señales de alto o bajo voltaje en función de los voltajes de sus entradas. Debido a que el voltaje exacto puede variar significativamente de un sistema a otro y de un circuito a otro, la fidelidad se mantiene al diferenciar solo entre voltaje alto y voltaje bajo (encendido y apagado o 1 y 0).
Yo diría que en las computadoras modernas el sistema no es en realidad solo binario. Dado que las palabras tienen una longitud de 32/64 bits, la base se puede ver como 2 ^ 32 o 2 ^ 64 (si hacemos el paralelo con la codificación del ADN). Pero al menos la base es 256 (byte).

Científico loco · Answer 1

La hipótesis actual es que el ARN llegó primero, el ADN y las proteínas llegaron después. Entonces, la razón por la que se usan cuatro bases podría estar relacionada con el mundo inicial del ARN, y luego el ADN simplemente reutilizó las bases de ARN ya existentes en una forma ligeramente modificada. En el mundo del ARN, todas las funciones debían ser realizadas por el ARN. Probablemente sería importante tener más bases disponibles que dos para poder adoptar diversas estructuras y crear bolsas de unión o sitios activos para las ribozimas.

Realmente no se puede pensar en el código genético como un dispositivo abstracto de almacenamiento de datos. Hay consecuencias físicas y químicas en la elección de la codificación. Por ejemplo, las proteínas deben poder unirse al ADN y reconocer patrones particulares. Con su código binario, la secuencia de reconocimiento tendría que ser más larga, porque cada par de bases contiene menos información. Los anticodones de ARNt tendrían que ser más grandes para que la biosíntesis de proteínas funcione con el código binario. Otro problema que juega un papel en algunos procesos es que los pares de bases GC son más estables que los pares de bases AU/AT.

Todo esto son solo hipótesis. Evolution no elige necesariamente la mejor opción, a veces es solo la más conveniente que aún funciona bien.

También encontré una reseña titulada "¿Por qué hay cuatro letras en el alfabeto genético?" eso hace un punto similar al primero.

Todos los modelos actuales para explicar el hecho de que tenemos cuatro tipos de bases en nuestra articulación del alfabeto genético, en forma encubierta o abierta, suponiendo que el alfabeto genético evolucionó en un mundo de ARN.

Otro factor que no pensé que se menciona allí es que mientras más bases hacen mejores ribozimas, más bases también disminuyen la precisión de la replicación.

En resumen, las estructuras similares al ARN bidimensionales (y, presumiblemente, también las estructuras tridimensionales) se definen mejor a medida que aumenta el tamaño del alfabeto, mientras que la precisión de la replicación disminuye.

esa es una respuesta maravillosa, gracias! hay algunas ideas en las que no he pensado, especialmente la hipótesis del mundo del ARN. ¡estupendo! ¡Y gracias por el enlace al periódico!
"Realmente no se puede pensar en el código genético como un dispositivo abstracto de almacenamiento de datos. Hay consecuencias físicas y químicas en la elección de la codificación". Este es un muy buen resumen sucinto.

Robar · Answer 2

¿Por qué la naturaleza utiliza un sistema de 4 niveles (ADN) para codificar la información?

Respuesta corta: Facilidad de fabricación, simplicidad de combinación, suficiencia para los requisitos. Menos bases simples requieren menos esfuerzo para crear, proporcionan menos coincidencias posibles, pero es lo suficientemente complejo como para codificar lo que se requiere mientras conserva la degeneración suficiente para el éxito. También fue la coincidencia de la coevolución de la replicasa-alfabeto, ocurriendo ambos en el mismo lugar al mismo tiempo.

Respuesta más larga:

Primero, no soy biólogo, por lo que esta pregunta podría ser ingenua:

Principiantes y expertos son bienvenidos en SE.

Todo nuestro procesamiento y almacenamiento de información se basa en una lógica de 2 niveles, bits con 0 y 1.

número de Euler ( $e$ ) se define como la suma de una serie infinita $\sum_{n=0}^\infty \frac{1}{n!}$ y tiene la economía de radix más baja , pero no es conveniente implementarlo en circuitos lógicos. Con la economía radix de $e$ establecido en 1.000, el ternario es 1.0046 y el binario es 1.0615.

Las computadoras ternarias se han construido utilizando lógica ternaria y, aunque no son comunes, la lógica ternaria se usa en SQL ; incluso en computadoras basadas en binario.

La mayoría , pero no todo, nuestro procesamiento y almacenamiento de información se basa en una lógica de dos niveles .

Ahora, el ADN almacena la información en un sistema de 4 niveles: A, C, G, T. Tres pares de bases forman un codón y pueden codificar 4^3 aminoácidos.

La mayoría, pero no todos .

Las cinco nucleobases canónicas o primarias son: adenina (A), citosina (C), guanina (G), timina (T) y uracilo (U). El ADN usa A, G, C y T, mientras que el ARN usa A, G, C y U.

En el laboratorio se ha creado ADN con 6 y 8 bases, es funcional.

Consulte el informe (de pago): " Hachimoji DNA and RNA: A genetic system with eight building blocks ", 22 de febrero de 2019, por Shuichi Hoshika, Nicole A. Leal, Myong-Jung Kim, Myong-Sang Kim, Nilesh B. Karalkar, Hyo-Joong Kim, Alison M. Bates, Norman E. Watkins Jr., Holly A. SantaLucia, Adam J. Meyer, Saurja DasGupta, Joseph A. Piccirilli, Andrew D. Ellington, John SantaLucia Jr., Millie M. Georgiadis, y Steven A. Benner. ( Versión de caché de Google ).

" Fig. 4 Estructura y propiedades fluorescentes de las moléculas de ARN de hachimoji.
(A) Esquema que muestra el aptámero completo de la variante de espinaca de hachimoji; los componentes de nucleótidos adicionales del sistema de hachimoji se muestran como letras negras en las posiciones 8, 10, 76 y 78 (B, Z, P y S, respectivamente). El flúor se une en el bucle L12 (25). (B a E) Fluorescencia de varias especies en cantidades iguales según lo determinado por UV. La fluorescencia se visualizó bajo una luz azul (470 nm) con un filtro ámbar (580 nm)
(B) Control solo con flúor, sin ARN
(C) Espinaca Hachimoji con la secuencia mostrada en (A)
(D) Aptámero nativo de espinaca con flúor.
(E) Aptámero de flúor y espinaca que contiene Z en la posición 50, reemplazando el par A:U en las posiciones 53:29 con G:C para restaurar el triple observado en la estructura cristalina. Esto coloca al cromóforo Z desactivador cerca del flúor; Los espectros de CD sugieren que esta variante tenía el mismo pliegue que la espinaca nativa (fig. S8)".

El tubo de centrífuga C contiene la espinaca con el ADN que contiene ocho bases .

¿Hay alguna buena razón por la que durante la evolución temprana, se prefiera un sistema de 4 niveles (que puede almacenar 2 bits por entidad de codificación) sobre un sistema de 2 niveles o sobre sistemas más grandes?

Sí.

La fidelidad de copia disminuye aproximadamente exponencialmente con el aumento del tamaño (N pares) del alfabeto (manteniendo fija la longitud del genoma). La razón de esto es que a medida que se agregan más letras al alfabeto, se parecerán cada vez más entre sí y, por lo tanto, aumenta la posibilidad de emparejamiento incorrecto y mutagénesis.
La eficiencia metabólica general y la aptitud están determinadas por el tamaño, tenemos 20 aminoácidos para codificar (más pequeño hace 16 o menos) y 3 codones de terminación . Así que tenemos un espacio para 64 y confiamos en la degeneración para proporcionar un grado de ' corrección de errores ' (sinonimización) donde los errores se convierten, generalmente para producir errores no fatales. Si bien los errores de traducción rara vez fatales aún pueden causar enfermedades raras .

Ya estamos funcionando de manera ineficiente, ir a un mayor número de pares introduce una complejidad innecesaria y ir más pequeño no está disponible para la cantidad de aminoácidos que se deben codificar. Aumentar la longitud del codón hace que el ADN sea más grande, ya que debe estar enrollado para introducirlo en las células; un tercio de ADN más grande encajaría mejor en células que también son un tercio más grandes.

En el artículo de opinión "¿ Por qué hay cuatro letras en el alfabeto genético? ", Nature Reviews Genetics volumen 4, páginas 995–1001 (2003), de Eörs Szathmáry, se encuentran las siguientes observaciones:

Página 995:

"Hay cuatro limitaciones principales para la incorporación exitosa de un nuevo par de bases $^{[6–8]}$ :

estabilidad química (la base no debe descomponerse fácilmente);

estabilidad termodinámica (los nuevos pares de bases no deberían desestabilizar las estructuras de ácido nucleico);

procesabilidad enzimática (las polimerasas deberían aceptar los pares de bases como sustratos, catalizar la adición a la imprimación y ser capaces de llevar a cabo el proceso); y

selectividad cinética ( ortogonalidad a otros pares de bases).

Los cuatro criterios son importantes, pero la combinación de los dos últimos, que podríamos llamar replicabilidad, ha recibido especial atención porque es el principal obstáculo para agregar al alfabeto genético".

Página 997:

Argumentos teóricos La
viabilidad de los pares de bases alternativos plantea la pregunta: ¿por qué hay cuatro bases en el alfabeto genético natural? Como señaló Orgel, hay dos tipos de respuesta: o la evolución nunca ha experimentado con pares de bases alternativos o cuatro bases 'fueron suficiente' $^{[20]}$ . La primera opción podría ser válida para los pares de bases hidrofóbicos discutidos anteriormente (podría faltar una síntesis temprana adecuada), pero es poco probable que sea cierto para todas las bases de enlaces de hidrógeno en un "caos químico" prebiótico. En cualquier caso, no explica por qué no tenemos solo dos bases. $^{[21–24]}$ . Por lo tanto, parece que vale la pena seguir con la segunda opción: ¿por qué podrían ser suficientes cuatro bases? Si se entiende "suficiente" en términos de estabilidad evolutiva, significa optimización dentro del marco de las restricciones estructurales que ofrece la selección natural. Aquí, describo los intentos de mostrar que cuatro bases son óptimas bajo la SELECCIÓN ESTABILIZADORA, especialmente cuando consideramos el EQUILIBRIO DE MUTACIÓN-SELECCIÓN. Luego discuto la evidencia del tamaño óptimo del código genético obtenido de la SELECCIÓN DIRECCIONAL in silico y finalmente analizo una contribución más abstracta de la llamada TEORÍA DE CODIFICACIÓN DE ERRORES".

Página 1000:

"Las investigaciones teóricas basadas en estudios estructurales, energéticos y teóricos de la información confirman la opinión de que el aumento del tamaño del alfabeto disminuye la fidelidad de copia mientras aumenta la densidad de la información. Esto indica que debe haber un tamaño óptimo del alfabeto en términos de aptitud, ya sea que asumamos que la genética. el alfabeto estaba fijado en un mundo de ARN o no.

...

Según la visión basada en el mundo del ARN, el alfabeto genético se fijó hace más de 3 mil millones de años. $^{[31]}$ , y el origen del código genético y la traducción sucedieron posteriormente $^{[42]}$ . Esta línea de razonamiento indica que la división del trabajo informacional/operacional entre los ácidos nucleicos y las proteínas $^{[43}]$ ha desacoplado el alfabeto genético de las limitaciones de funcionalidad enzimática. Como el código genético evolucionó en el contexto de un cierto alfabeto genético, cualquier cambio adicional del alfabeto habría sido innecesario y/o extremadamente improbable.

Sin embargo, si el código genético se originó por la coevolución simultánea de ácidos nucleicos y proteínas (un modelo mucho más complicado), entonces la fijación del alfabeto genético debe considerarse en este complejo contexto. Aquí, la visión general de Mac Donaill $^{[38]}$ ayuda: la densidad de información del alfabeto es un concepto útil, ya sea que la función ejercida sea ribozímica o una función mensajera en la síntesis de proteínas. En este caso, surge fácilmente el problema del tamaño del "alfabeto catalítico" (el número de aminoácidos codificados): ¿por qué tenemos 20 en lugar de, por ejemplo, 16 o 25 aminoácidos diferentes? Se ha señalado que algunas de las consideraciones discutidas en este artículo (efectos sobre la eficiencia catalítica y la fidelidad de la traducción) se aplican a este problema relacionado. $^{[32}]$ . Sin embargo, es probable que esté involucrado otro factor crucial: el costo metabólico de producir aminoácidos. Un aminoácido que pertenece a la misma familia biosintética $^{[43]}$ Se espera que aumente la eficiencia catalítica solo modestamente y es probable que su costo metabólico sea pequeño. Por el contrario, es probable que un aminoácido de una nueva familia biosintética confiera una gran ventaja enzimática, pero se espera que incurra en altos costos metabólicos (por ejemplo, muchos pasos nuevos que requieren ATP)".

Referencias:

$[6.]$ Mathis, G. & Hunziker, J. Hacia un dúplex similar al ADN sin pares de bases con enlaces de hidrógeno. Angew. química En t. ed. 41, 3203–3205 (2002).

$[7.]$ Ogawa, AK, Wu, Y., Berger, M., Schultz, PG y Romesberg, FE Diseño racional de un par de bases no naturales con mayor selectividad cinética. Mermelada. química Soc. 122, 8803–8804 (2000).

$[8.]$ Kool, ET ADN modificados sintéticamente como sustratos para polimerasas. actual Opinión química Biol. 4, 602–608 (2000).

$[20.]$ Orgel, LE Ácidos nucleicos: adición al alfabeto genético. Naturaleza 343, 18–20 (1990).

$[21.]$ Orgel, LE Evolución del aparato genético. J. Mol. biografía 38, 381-393 (1968).

$[22.]$ Crick, FHC El origen del código genético. J. Mol. Biol. 38, 367–379 (1968).

$[23.]$ Wächtershäuser, G. Un precursor de purina de los ácidos nucleicos. proc. Academia Nacional. ciencia EE. UU. 85, 1134–1135 (1988).

$[24.]$ Zubay, G. Un precursor de purinas de ácidos nucleicos. Chemtracts 2, 439–442 (1991).

$[31.]$ Szathmáry, E. Cuatro letras en el alfabeto genético: ¿un óptimo evolutivo congelado? proc. R. Soc. largo B 245, 91–99 (1991).

$[32.]$ Szathmáry, E. ¿Cuál es el tamaño óptimo para el alfabeto genético? proc. Academia Nacional. ciencia EE. UU. 89, 2614–2618 (1992).

$[38.]$ Mac Donaill, DA Por qué la naturaleza eligió A, C, G y U/T: una perspectiva de codificación de errores de la composición del alfabeto de nucleótidos. original Evolución de la vida Biosfera 33, 433–455 (2003).

$[42.]$ Szathmáry, E. El origen del código genético: aminoácidos como cofactores en un mundo de ARN. Tendencias Genet. 15, 223–229 (1999).

$[43.]$ Wong, JT Una teoría de la coevolución del código genético. proc. Academia Nacional. ciencia EE. UU. 72, 1909–1912 (1975).

Más información:

Página web de Wikipedia de Eörs Szathmáry
http://www.colbud.hu/fellows/szathmary.shtml - El Collegium Budapest está cerrado.

Instituto de Investigación Scripps

Página web de Steven Benner
http://www.chem.ufl.edu/benner.html : el Dr. Benner dejó la UoF en 2005.

Preguntado de otra manera: ¿Por qué la evolución no prefirió tener un sistema binario para almacenar y procesar datos? Para nosotros, el binario es mucho más fácil, y las pocas pruebas de procesamiento de datos exóticos de alto nivel no fueron realmente exitosas.

Binario no tiene nada que ver con la evolución. Pocos de nosotros podemos contar hasta 255 en binario, preferimos el decimal. Tanto las computadoras ternarias como SQL son "realmente exitosas", la gente prefiere las alternativas.

Esta pretende ser una respuesta adecuada para un laico. Se puede consultar el artículo de Eörs Szathmáry y sus referencias asociadas para obtener más detalles.

Gracias por esta respuesta tan interesante, después de 3,5 años. da una perspectiva bastante más amplia.
@NicoDean De nada. Me referí a la información más reciente disponible y la usé para mi respuesta, pero finalmente un artículo de opinión anterior ofreció una explicación más simple. Existen muchas teorías, no todas están refutadas.
Acabo de encontrarme con esta publicación. Buena respuesta, @Rob. Realmente un gran esfuerzo. Su respuesta sirve como un excelente ejemplo de las respuestas bien citadas y de alta calidad que estamos buscando aquí. Gracias

David · Answer 3

Respuesta general

El uso del binario en las computadoras surgió principalmente de consideraciones prácticas sobre cómo representar dígitos usando corriente eléctrica o voltaje (es decir, 'encendido' o 'apagado' es lo menos equívoco). Tal representación no era solo, o incluso principalmente, para almacenar información de diferentes tipos numéricos, sino para programar lógica usando álgebra booleana . El almacenamiento físico de datos puede estar en varios formatos diferentes (magnético, óptico, eléctrico), pero estos son funcionalmente equivalentes y la recuperación y conversión de datos binarios en números enteros reales, texto o imágenes es predominantemente una preocupación matemática más que física.

El ADN tiene varias funciones, pero estas no incluyen una preocupación con la lógica de programación. En el almacenamiento de datos de diferentes tipos, no hay problema para representar diferentes bases o raíces: hay suficientes bases de ácido nucleico diferentes disponibles para representar dígitos de base 4. La cuestión más pertinente en el almacenamiento es la que no surge en la memoria de la computadora, es decir, la transformación física de la información en otras moléculas. Esto puede tomar la forma de copia inversa de un ácido nucleico genómico (ADN o, quizás originalmente, ARN) en la replicación , la copia de una hebra de información en un dúplex de ADN en una sola hebra de un ácido nucleico relacionado pero no idéntico en el transcripción a ARNm (ARN mensajero) y 'lectura' ( traducción) de la información en las bases químicas del ARNm para producir una proteína compuesta de aminoácidos, moléculas químicas bastante diferentes.

Por lo tanto, las consideraciones electrónicas o matemáticas que conducen a la afirmación “En computación, lo binario es mucho más fácil” no tienen relevancia para el ADN y el código genético, donde las consideraciones químicas y moleculares estructurales son primordiales. La suposición de que existe la necesidad de explicar por qué la información en el ADN no es específicamente binaria es, por lo tanto, falsa.

Especulación sobre la química estructural de la evolución de la información genética.

La pregunta de por qué el sistema de 4 dígitos (en lugar de 2 o 6, etc.) sigue siendo válida, pero no se puede responder de manera definitiva. Sin embargo, vale la pena discutir para ilustrar a los científicos numéricos las formas en que las consideraciones estructurales podrían haber determinado la elección del sistema de información. Consideraré dos etapas tempranas en la evolución bioquímica en las que se puede haber seleccionado el sistema de 4 dígitos, después de lo cual, uno debe reconocerlo, podría haber grandes barreras para un cambio adicional. Renunciar a Java y cambiarse a Python (o simplemente cambiar de Java I a Java II) probablemente no era una opción.

LA QUÍMICA DEL GENOMA DE AUTO-REPLICACIÓN

Asumiré uno de los principios principales de la Hipótesis del Mundo del ARN : que el ARN precedió al ADN como genoma celular. Incluso si el genoma original fuera ADN, la pregunta es la misma (por qué cuatro bases de ácido nucleico en lugar de dos o seis, etc.) y los requisitos de su constitución química son similares: permitir la autorreplicación (de ahí la necesidad de considerar números pares). ).

Se podría considerar que primero surgió un ARN con dos bases: supongamos adenina (A) y uracilo (U) por el bien del argumento. Más tarde, la célula adquirió la capacidad catalítica para sintetizar guanina (G) y citosina (C), de modo que se hizo posible el desarrollo de un genoma AU autorreplicante a un genoma AUGC. Suponiendo que esto ocurriera antes de que surgiera el potencial de codificación de aminoácidos del ARN, ¿qué podría haber favorecido al genoma más complejo? Podría haber tenido algo que ver con el hecho de que hay tres, en lugar de dos, enlaces de hidrógeno en un par de bases GC , lo que tal vez produce una estructura diferente de ARN: ARN.que era más estable o más fácil de replicar por alguna razón. Alternativamente, puede no haber tenido nada que ver con la estructura de la hélice ARN:ARN, sino que fue un efecto secundario de la adquisición de bases adicionales cuya mayor versatilidad química mejoró las funciones enzimáticas (actividad ribozima) del ARN primitivo .

Si más significaba mejor, ¿por qué no seis bases en lugar de cuatro? Puede haber razones químicas específicas, como el desarrollo más lento de las actividades enzimáticas para producir otras bases de ácido nucleico, o que con más bases, la posibilidad de emparejamiento incorrecto de bases era mayor. (El 'principio de Ricitos de Oro' lleva un largo camino.) O puede haber sido que el sistema funcionó lo suficientemente bien, fue seguido por el desarrollo de un código triplete, en cuya etapa el sistema se congeló.

LA QUÍMICA ESTRUCTURAL DE LA TRADUCCIÓN

Es posible que la suerte ya se haya echado en el genoma, pero sería una pena no mirar la química de la decodificación de la información genética, ya que no es una consideración para los sistemas informáticos. Entonces, consideremos una competencia entre organismos estrechamente relacionados, uno con un genoma de dos bases y otro con un genoma de cuatro bases (e incluso un genoma de seis bases). El requisito es codificar la información para una serie de aminoácidos que pueden dar versatilidad funcional a las proteínas, alrededor de los 20 (más las señales de terminación) que tenemos hoy. El tamaño del codón (el tamaño de la palabra), es 3 en un sistema de 4 bits, acomodando 64 (4 ³ ) codones posibles en un código genético (el estándar). Si se usara un sistema de almacenamiento de datos de 2 bits, se requeriría un tamaño de palabra de 5 para generar 32 (2 ⁵) codones posibles, mientras que un sistema de 6 bits podría reducir el tamaño de palabra a 2 con 36 (6 ² ) codones posibles.

Las consecuencias físicas de sistemas tan diferentes se verían en el proceso de decodificación en el que una molécula adaptadora, el ARN de transferencia (ARNt), entrega aminoácidos al centro de la peptidil transferasa del ribosoma (en un extremo) mientras interactúa con el ARN mensajero (ARNm). en el otro extremo a través del apareamiento de bases codón-anticodón. Se podría argumentar que el anticodón de ARNt de tres bases encaja en el bucle al final del tallo helicoidal del anticodón de una manera que le permite adoptar una posición relativamente precisa (sí, sé sobre el bamboleo) donde puede hacer contacto apropiado con el ARNm bases de codones (ver el diagrama a continuación).

Un anticodón quintillizo y una interacción de cinco bases (aunque no imposible) parecería menos adaptado naturalmente a la química estructural del ARN. Objeciones similares no se aplicarían a una interacción de dos bases, aunque se podría argumentar que la energía total de interacción entre dos pares de bases fue insuficiente para evitar errores. La consideración del error también se aplica a un sistema binario donde la diferencia de energía entre una interacción de cinco bases y una interacción de cuatro bases (es decir, un desajuste simple) sería baja. De hecho, si hubiera ocurrido la competencia hipotética entre organismos de 2 bits y de 4 bits, el sistema de 2 bits también habría sido más propenso a errores de frecuencia debido al deslizamiento durante la replicación .

La última palabra…

… va a Steven Benner, cuyo grupo ha construido ADN de 8 bases en el laboratorio:

“La capacidad de almacenar información no es muy interesante para la evolución. Tienes que ser capaz de transferir esa información a una molécula que haga algo”.

Acabo de encontrarme con esta publicación. Buena respuesta, @David. Realmente un gran esfuerzo. Ciertamente aprecié leer su respuesta sucinta pero detallada. Siempre es bueno ver múltiples respuestas excelentemente escritas a una sola pregunta. +1. Gracias

¿Por qué Nature usa un sistema de 4 niveles para codificar información en el ADN?

mario kren

mario kren

roland

canadiense

mario kren

mario kren

roland

WYSIWYG

mario kren

perry

mario kren

perry

Potencial de inacción

rus9384

Respuestas (3)

Científico loco

mario kren

Maximiliano Prensa

Robar

mario kren

Robar

elforestecólogo

David

elforestecólogo

¿Cómo se miden las tasas de error de la ADN polimerasa?

Alternativas a la PCR

Recogiendo ADN de plásmido usando Nanodrop, pero no usando electroforesis

Correlación de ADN no codificante con ADN codificante

¿Hasta qué punto el código genético es algo más que un código?

¿La longitud de los electrodos en la cámara de electroforesis debe ser proporcional al tamaño de la cámara?

¿Es posible obtener cadenas simples de ADN en solución? [cerrado]

¿Cómo pueden ambas cadenas de ADN codificar proteínas con funciones similares?

¿Cómo afecta el tamaño del inserto a la tasa de recombinación homóloga en la levadura?

¿Cómo surgen los surcos mayores y menores en la hélice del ADN? [duplicar]