¿Por qué se usan 3 nucleótidos como codones para el mapeo de aminoácidos en el ADN?

El ADN está hecho de 4 nucleótidos únicos. Al codificar una proteína, se utiliza una secuencia de 3 nucleótidos para codificar cada aminoácido. ¿Por qué los codones tienen 3 nucleótidos de longitud?

Puede encontrar una pregunta relacionada aquí: ¿por qué hay exactamente cuatro nucleobases en el ADN?

Pregunté y respondí esto aquí porque publiqué esta respuesta a la pregunta vinculada, pero eso no fue realmente una respuesta. Ahora hay respuestas alternativas mucho mejores, ¡así que hice la pregunta que realmente respondí aquí!
Su pregunta debería ser más adecuada (o más bien con fines aclaratorios) como bases nitrogenadas. Creo que tu consulta me confundió un poco. Un artículo que encontré en línea explica esto de una manera más o menos factible: biologie.uni-hamburg.de/b-online/e21/21a.htm

Respuestas (4)

El dogma central de la biología molecular: el ADN hace que el ARN haga proteínas

El ADN es una referencia para las proteínas*, que son las moléculas funcionales en las células. Estos se componen de 20 aminoácidos únicos, y cada uno está codificado por un tramo de ADN conocido como codón. Los codones siempre tienen 3 pares de bases (nucleótidos) de longitud.

El ADN está hecho de 4 nucleótidos únicos; ( A )denina, ( G )uanina, ( C )itosina y ( T )himina. Esto significa que hay 64 codones únicos que se pueden formar con estas 4 bases (4*4*4).

Teoría uno: capacidad de evolución

Si los codones tuvieran solo 2 bases de longitud, la variedad de codones que se podrían crear sería menor (solo 16 secuencias únicas si todavía hay 4 nucleótidos). Se requerirían más nucleótidos únicos para obtener suficientes secuencias únicas para codificar los 20 aminoácidos (así como los codones STOP). Por ejemplo, para obtener 64 secuencias únicas usando un sistema de 2 bases por codón, se necesitarían 8 nucleótidos únicos.

Nunca 'sabremos' lo que sucedió en términos evolutivos, pero parece probable que el sistema de codones de 3 bases (nucleótidos) hubiera surgido después de un período de un sistema de 2 bases, a medida que los sistemas biológicos se volvieron más complejos. Esto habría permitido mucha más variación en los aminoácidos utilizados y, por lo tanto, más "capacidad de evolución", lo que habría sido muy ventajoso para los primeros organismos.

Sin embargo, como el sistema de 4 nucleótidos únicos/3 codones es omnipresente en toda la vida que hemos descubierto en la Tierra, parece probable que, al comienzo del ADN (de hecho, probablemente el ARN), este fue el sistema que funcionó, o al menos, este es el que sobrevivió (aunque, como señala correctamente Kevin, no sabemos si alguna vez hubo otros sistemas). Pueden haber surgido variaciones a lo largo de los años, pero es este sistema el que ha prevalecido aquí en la Tierra.

Consulte esta pregunta para obtener información más interesante: ¿por qué-20-aminoácidos-en lugar-de-64?

Teoría dos: la "redundancia" de codones transmite información adicional

Esta teoría no es mutuamente excluyente con la descrita anteriormente. En un artículo reciente, D'Onofrio y Abel [ 1 ] afirman que los ribosomas se detienen por diferentes períodos de tiempo en diferentes codones (incluso si el codón codifica para el mismo aminoácido), y que esta pausa afecta la estructura tridimensional del final. proteína.

Por lo tanto, la secuencia de nucleótidos contiene al menos dos "capas" de información: en primer lugar, qué aminoácido debe agregarse y, en segundo lugar, el codón específico utilizado para ese aminoácido puede afectar la estructura final de la proteína. Esto no se podría hacer con menos nucleótidos, pero podría decirse que incluso se podría ejercer un mayor control con más nucleótidos, pero tal vez esto vuelva a mi primer punto de que este sistema evolucionó hace tanto tiempo que no se necesitaban más nucleótidos para que la vida "funcionara". y proliferar en todo lo que vemos hoy.

  1. D'Onofrio y Abel, 2014. Fronteras en Genética . La redundancia del código genético permite la pausa traduccional

*Solo alrededor del 1% de nuestro genoma codifica proteínas, y muchos productos de ARN que no codifican proteínas tienen funciones muy importantes, pero no entraré en esto aquí. Baste decir que me estoy refiriendo a las regiones codificantes de proteínas del ADN.

En general, esta es una buena respuesta. Sin embargo, no estoy de acuerdo con decir "determinado que es el más eficiente". No tenemos idea de que alguna vez existieron otras combinaciones. 4 nucleótidos en combinaciones de 3 no funcionaron. Eso es todo lo que sabemos.
@Kevin gracias, y tienes toda la razón. Le di a la respuesta una reelaboración general porque no creo que fluya correctamente al haber sido adaptada de una pregunta diferente, y he tenido en cuenta su comentario. Muchas gracias.
El comentario NO es una crítica hacia la respuesta. Sé que todo el mundo está hablando de central dogma of molecular biologypero es un nombre tan malo. El dogma no tiene cabida en la ciencia. Además, ahora sabemos que existe retrotranscripción y, por lo tanto, el dogma central de la biología molecular no siempre es cierto.
Gracias por publicar la teoría en dos partes. Siempre me he preguntado por qué la repetición del trinucleótido CAG en HTT puede causar la enfermedad de Huntington, pero parece que CAACAG no lo hace.
Hombre, mi tesis de licenciatura (hace 8 años) se basó en la idea de diferentes codones que causan cambios conformacionales. Comparé los codones de regiones estructuradas en proteínas con los no estructurados y encontré que el uso de codones era diferente cuando se codificaba el mismo aminoácido. El tipo que lo marcó me dio el 20%. Me llevó a obtener una calificación final baja. Requerido Obtuve mi maestría antes de mi doctorado. Probablemente me hizo retroceder 2 años. Y ahora está publicado en Frontiers in Genetics -_- La academia apesta cuando eres pequeño.

Creo que se puede hacer un caso sólido para los tres codones nt que ya existen en el código genético primordial, que incluía solo ocho aminoácidos abióticos (esto todavía se ve claramente hoy en día en las tablas de traducción donde la mayoría de los aminoácidos abióticos se definen por cuatro o más codones) . Sin embargo, en este código genético primordial, el último nt probablemente no tenía sentido (esto se ha reinventado en muchos genomas mitocondriales donde un solo ARNt, generalmente gracias a una U modificada en la posición de oscilación del anticodón, reconoce hasta 4 codones). Suponiendo que existiera el código genético primordial de codones de tres nt, vemos que la razón de la estructura de codones de tres nt no era que la estructura de codones de dos nt no fuera suficiente para codificar todo (4 ^ 2> 9, habría sido suficiente), sino algo más . Entonces, ¿qué podría ser? Mi conjetura es que tiene que ver con A,P, La estructura del sitio E del ribosoma no encaja en una configuración molecular más pequeña (es decir, no podría tener los sitios A, P, E adyacentes dentro del espacio limitado por solo cinco enlaces fosfodiéster (seis codones nt, tres dos nt) vs. ocho enlaces fosfodiéster (nueve nt, tres codones de tres nt)). En resumen, mi opinión es que la estructura ribosomal primordial fue el factor clave para la estructura de codones de tres nt del código genético, no podría haber funcionado con nada menos y cualquier cosa más habría sido un desperdicio.

Esta es una información muy interesante (perdón por la demora en comentar). ¿Podría proporcionar alguna referencia/lectura adicional?

¿Puedo sugerirle que vaya directamente a la fuente? Aquí hay un enlace a un artículo publicado por Francis Crick (et al) en 1957 titulado: 'Códigos sin comas' http://www.ncbi.nlm.nih.gov/pmc/articles/PMC528468/

La fuente que vinculaste es realmente buena, pero la vinculación simple no es exactamente de lo que se trata este sitio. Por supuesto que es más fácil, pero tómese su tiempo y elabore su respuesta, explique e interprete las fuentes que utiliza.
Bienvenido a Biología.SE. Un enlace solo no es suficiente para una respuesta. Tómese el tiempo para elaborar su respuesta o convierta su respuesta en un comentario.

Por la misma razón, hay 8 bits en un tipo de datos de caracteres regulares en los lenguajes de programación de la vieja escuela (antes de la internacionalización y Unicode).

En las interpretaciones ASCII modernas, tiene una cierta cantidad de caracteres que deben codificarse, en algún lugar entre 128 y 256. 8 bits sería el mínimo suficiente para la codificación ASCII (moderna extendida). (No relacionado con la pregunta: en computación, a menudo ayuda que la cantidad de bits en varias operaciones sea una potencia de 2. Además, las versiones originales de ASCII especificaban la codificación de 7 bits antes de que se extendiera a un byte completo en un principio. esfuerzo de apoyo a la internacionalización.)

Volviendo a los nucleótidos, hay 20 aminoácidos. Piense en un codón como el equivalente de un "byte" y una base (nucleótido) como el equivalente de un "bit". Los conjuntos de 2 codones serían insuficientes, excepto si planea construir a medida una forma de vida de genoma compacto que solo admita 15 aminoácidos, un codón de terminación y sin oscilaciones.

El apoyo a todos los aminoácidos más un codón de parada requiere al menos 21 valores de codón distintos. En particular, encuentra la potencia más pequeña de 4 >= 21, que resulta ser 3.

Una ventaja adicional: el número de valores de codones es aproximadamente el triple del número de aminoácidos (más un codón de parada), lo que permite la redundancia: algunos aminoácidos están codificados por más de un codón, que actúa como un amortiguador contra las mutaciones.