¿Por qué hay exactamente cuatro nucleobases en el ADN?

¿Alguien sabe por qué el ADN está compuesto por cuatro nucleobases? En particular, ¿hay una explicación para el número? ¿Por qué cuatro y no dos u ocho?

esto acaba de llegar: dos nuevas bases añadidas a E coli (X e Y) se reproducen. wired.com/2014/05/synthetic-dna-cells no tiene claro cuánta adaptación se necesita para que X e Y funcionen para codificar genes.

Respuestas (7)

Una respuesta ahora eliminada atribuyó esto a un argumento basado en la codificación de aminoácidos en codones pero, como señaló Konrad Rudolph en un comentario, los argumentos basados ​​​​en codones no pueden ser correctos porque el sistema de 4 bases probablemente sea anterior a la evolución de traducción de proteínas.

Entonces, ¿por qué cuatro?

Sugiero que proviene de una combinación de factores que lo hacen "perfecto" para los replicadores basados ​​en ARN: más sería malo y menos también sería malo. Las cuatro bases pueden copiarse con alta confiabilidad porque dos características se combinan para excluir los emparejamientos incorrectos: hay dos clases de tamaño, lo que significa que cualquier emparejamiento purina-purina o pirimidina-pirimidina da como resultado una separación incorrecta entre las hebras, excluyendo los enlaces AG y CU; y hay dos clases basadas en el número de enlaces OH, lo que limita el potencial de los enlaces AC y GU. Más bases deben, inevitablemente, debilitar la fuerza de estos enfoques excluyentes y aumentar el número de desemparejamientos. Los replicadores del mundo del ARN habrán carecido de los sofisticados mecanismos de reparación y comprobación de errores de las formas de vida modernas, por lo que es probable que este aumento en los emparejamientos erróneos no se corrija.

Por supuesto, un sistema de dos bases sería aún más capaz de reducir los errores. Sugiero que la ventaja del sistema de cuatro bases es que permite que se forme una estructura tridimensional mucho más compleja en el ARN y, por lo tanto, permite una gama más amplia de capacidades catalíticas. Solo he considerado los números pares porque solo los sistemas con números pares podrían usar el estilo de emparejamiento de bases de Watson-Crick.

También sugiero leer el artículo de 2003 de Eörs Szathmáry sobre esta misma pregunta.

Apéndice

Un grupo en California acaba de publicar un artículo en el que agregaron con éxito un tercer par de bases estable en el ADN. Creo que esto podría arrojar algo de luz sobre por qué cuatro: puede leer sobre esto aquí u obtener el documento completo aquí (Naturaleza, así que pague amurallado).

Aquí hay una posible respuesta dada por este documento:

http://www.ncbi.nlm.nih.gov/pubmed/16794952
o http://www.math.unl.edu/~bdeng1/Papers/DengDNAreplication.pdf

Da una explicación darwiniana a la pregunta. Aborda el problema desde la teoría de la comunicación de Claude Shannon. Trata la replicación del ADN conceptual y matemáticamente igual que una transmisión de datos. Concluye que el sistema de cuatro bases, no de dos, no de seis, replica la mayor cantidad de información genética en el menor tiempo posible.

La analogía comunicacional es así. Si tiene dos sistemas de transmisión de datos, uno puede transmitir, digamos, 1 MB por segundo y el otro puede hacer 2 MB por segundo pero cuesta menos del doble. La respuesta es obvia: comprará el segundo servicio por una tarifa más alta por costo. Como servicio de datos, no le importa qué información consume; puede ser spam, video, audio, etc. Lo único que importa es la velocidad de transmisión. En cuanto a la replicación del ADN, es como un canal de transmisión de datos cuando una base se replica una vez a lo largo de la plantilla de ADN madre. Tampoco le importa si el proceso es para el genoma de una bacteria, una planta o un genoma animal. La recompensa está en la información y el costo está en el tiempo. A diferencia de sus variedades de comunicación abiótica, el tiempo es tanto el remitente como el receptor de todos los mensajes de vida, y diferentes formas de vida o especies son simplemente teléfonos celulares del tiempo. Entonces, si un sistema puede replicar más información en una unidad de tiempo que otro, el más rápido ganará la carrera armamentista evolutiva. Una presa que opera en un sistema replicador lento no podrá competir ni adaptarse a un depredador que opera en uno rápido.

Ahora, debido a que el par AT tiene solo dos enlaces de hidrógeno débiles, pero el par CG tiene tres, A y T tardan menos tiempo en completar la duplicación que C y G. Aunque el tiempo de replicación es corto en una fracción de nano segundos, el tiempo se acumula rápidamente para genomas con pares de bases en miles de millones. Entonces, tener el par CG puede ralentizar la replicación, pero la ganancia está en la información. Un par de bases te da 1 bit por información de base. Dos pares te dan 2 bits por información base. Sin embargo, tener más pares de bases puede resultar en una disminución del rendimiento en la tasa de replicación de la información si las nuevas bases tardan demasiado en replicarse. De ahí la consideración de la tasa óptima de replicación medida en bits de información por base por tiempo. Sin información no habría diversidad, ni complejidad.

Con un simple cálculo de la tasa de transmisión/replicación de Shannon, puede calcular la tasa media para el sistema AT, el sistema CG, el sistema ATCG y para algunos sistemas hipotéticos de 6 bases, 2n bases cuyas nuevas bases toman progresivamente más tiempo. hora de replicar. El análisis muestra que el sistema ATCG tiene la tasa de replicación óptima si las bases CG tardan entre 1,65 y 3 veces más en replicarse que las bases AT. Es decir, un sistema de base 2 replica sus bases más rápido pero no lleva más información para tener una tasa de bits más alta. Del mismo modo, un sistema de base 6 tiene una mayor información por base pero se replica más lentamente en promedio para terminar con una tasa de bits subóptima.

Tasa de replicación del ADN

Según una comparación del artículo, el sistema de base 4 es aproximadamente un 40 % más rápido que el sistema solo A–T y un 133 % más rápido que el sistema solo G–C. Supongamos que la vida en la Tierra comenzó hace unos 4.000 millones de años, entonces el sistema AT solo retrasaría la evolución en 1.000 millones de años, el sistema G-C lo haría en 2.300 millones de años. Para un sistema hipotético de base 6, lo haría en 80 millones de años. En otras palabras, la vida está donde debería estar porque el sistema de base 4 puede transmitir información a través del cuello de botella del tiempo a la tasa de bits óptima.

En conclusión, la vida es replicar la mayor cantidad de información en el menor tiempo posible, y el sistema base-4 lo hace mejor. Si alguna vez hubo otros sistemas, habrían perdido la competencia informática frente al sistema de base 4 desde el principio. El principio de Darwin funciona en el nivel más básico e importante de la vida.

Hay otras explicaciones, todas no darwinianas. La mayoría se basan en las estructuras moleculares de la base. Pero este tipo de explicación bordea el argumento circular: usar observaciones para explicarse a sí mismo. También enfrentan este problema catch-22 ya que no hay forma de agotar todas las bases posibles para la replicación. Sin embargo, tales líneas de exploración son fructíferas independientemente porque cuanto más conocimiento, mejor. Pero sin tener en cuenta la información y su replicación, es difícil imaginar una respuesta sensata a la pregunta.

Bienvenido a Biología SE. Sería genial si pudiera ampliar su respuesta para incluir un resumen de los puntos principales. No podemos contar con que el enlace esté allí para siempre.
Puedes editar tu respuesta. (vea el enlace debajo de su publicación).
Genial explicación.
"y para algunos sistemas hipotéticos de 6 bases, 2n bases cuyas nuevas bases tardan progresivamente más tiempo en replicarse". - Esta suposición parece difícil de justificar.

También hay una dimensión química en esta pregunta.

Si observa los pares de bases Watson-Crick, puede ver que no hay mucho margen de maniobra:

Pares de bases Watson Crick

Las bases de nucleótidos tienen 2 o 3 enlaces de hidrógeno. Probablemente no sea estéricamente razonable tener 4.

Eso significa que solo hay un número limitado de formas en que las combinaciones de bases pueden ser complementarias y también específicas, ya que forman la doble hélice. Dado que los patrones de enlaces de hidrógeno A->T y T->A toman ambas combinaciones de donante-receptor, existe un posible emparejamiento de enlaces 2H.

Creo que hay 2 formas de configurar las tres bases de enlaces de hidrógeno, por lo que tal vez seis sean posibles, pero supongo que si expande el repertorio de emparejamiento de bases, uno podría comenzar a perder especificidad. Tal como están las cosas, si juegas lo suficiente con los nucleótidos, puedes hacer pares de bases que no sean de Watson-Crick y probablemente pierdas algo de la confianza en que tienes coincidencias exactas 1:1 entre pares de bases complementarios. Ya se puede demostrar que los pares de bases oscilantes en el ARN y los pares de bases de Hoogsteen permiten hélices triples y hélices de ARN de coincidencia no perfecta.

emparejamientos de base no WC

El sistema de ADN de 4 bases con enlaces AT y enlaces CG es el que evolucionó para ser utilizado por la mayoría de las criaturas vivientes en la Tierra, como se menciona en otras respuestas, porque puede codificar una tabla triple de bases para todos los aminoácidos utilizados, lo que permite algunos aminoácidos para tener más de un código de triplete. Sin embargo, existen ligeras variaciones del sistema: aunque los enlaces AT y CG no cambian, los nucleótidos pueden modificarse para marcar áreas del genoma en lo que es parte del código epigenético. La modificación más común es la adición de moléculas de metilo y 5-hidroximetilo a las bases, aunque todavía se están descubriendo más modificaciones.

Teóricamente, a partir de pirimidinas y purinas juntas, son 6 pares de bases = 12 bases posibles...

SI las nucleobases se desarrollan solo a partir de pirimidinas y NO de purinas ENTONCES son solo 2 pares de bases = ¡4 bases de pirimidinas posibles!...4 purinas y 12 purinas+pirimidinas

Descargo de responsabilidad: no soy biólogo ni químico ni teórico de la información. Solo quiero arrojar una perspectiva que he ensamblado a partir de las diversas respuestas aquí, pero que realmente no veo expresada en ninguna respuesta.

Es decir, creo que es fácil imaginar que 4 pares de bases son el resultado de un compromiso entre tener muchos pares de bases y tener pocos pares de bases. Es decir, es esencialmente el resultado de un problema de optimización. Hay algunas ventajas de tener más pares de bases y algunas ventajas de tener menos pares de bases, y 4 es simplemente la mejor compensación entre ellos. Al igual que con cualquier problema de optimización, es probable que el resultado sea bastante sensible a cómo formulamos exactamente la pregunta: exactamente en qué entorno evolucionó el sistema de 4 pares de bases, qué papel desempeñó el ARN en la vida en ese momento, exactamente cómo cuantificamos los beneficios. y los inconvenientes de varios sistemas de pares de bases, etc. Y quizás el sistema de 4 pares de bases evolucionó inicialmente en un entorno,

Probablemente, muchas de estas preguntas de modelado son lo suficientemente inciertas en la actualidad como para que sea imposible "ejecutar el problema de optimización" con confianza y confiar en el resultado. Pero probablemente el primer paso sería tratar de enumerar la mayor cantidad posible de factores en juego. Permítanme intentar eso, con la ayuda de las respuestas anteriores aquí:

Razones para preferir menos pares de bases

  • Menos pares de bases significan menos posibles vías de "emparejamiento erróneo", lo que podría disminuir la tasa de mutación

  • Menos pares de bases también significa que solo se deben usar los "mejores pares", lo que nuevamente reduce potencialmente la tasa de mutación.

  • Menos pares de bases simplifica el proceso de adquirir o sintetizar los pares de bases en primer lugar.

  • Puede afectar la velocidad de transcripción.

Razones para preferir más pares de bases

  • Más información almacenada por unidad de masa/volumen.

  • Potencialmente aumenta la gama de estructuras que se pueden construir directamente a partir del material genético.

  • Puede afectar la velocidad de transcripción.

Estoy seguro de que hay muchos otros factores a considerar.

No me queda claro si se puede decir algo cuantitativo sobre estas fuerzas opuestas con suficiente confianza para realmente "ejecutar la optimización" y confiar en la respuesta.

Y, por supuesto, presumiblemente hay mucho más que decir sobre el espacio sobre el que estamos optimizando: exactamente qué "pares de bases" posiblemente podrían usarse en primer lugar, como ya han abordado otras personas más calificadas.

Porque cuatro es el número mínimo posible. Si no hay un impulso para hacer que un sistema sea más complejo, nunca se ensamblará.

Entonces, se podría argumentar que un sistema similar podría haberse construido solo utilizando dos bases.

Multa.

Pruébalo.

Fracasarás miserablemente. Claro que puedes hacer una hebra de ADN que contenga solo adenina y timina. Pero, ¿quién impediría que la guanina y la citosina se formaran y se unieran a algo de desoxirribosa entonces? Entonces, ¿cómo administraría el almacenamiento, la preservación y la transferencia de información?

El emparejamiento de bases, sin importar lo complejo que pueda parecer, es la forma más sencilla de almacenar información de forma segura a nivel molecular para que pueda manejarse para su transferencia y traducción en otro lugar. Las combinaciones espaciales de enlaces de hidrógeno que se pueden establecer entre derivados de pirimidina y purina son sólo dos.

Para fines de replicación, necesita una ruptura de simetría adicional, lo que lo deja con dos bases, una en cada hebra de una doble hélice de ADN.

Dos por dos es cuatro.

PD: Por cierto, ¿quién diablos te dijo que hay exactamente cuatro nucleobases en el ADN? ¡Dígales que probablemente olvidaron la metilcitosina! El término "metilación" es solo una excusa para evitar admitir que el ADN usa cinco bases en lugar de cuatro. Abre tu mente.