¿Por qué 20 aminoácidos en lugar de 64?

Esta pregunta me hizo pensar en los aminoácidos y la ambigüedad en el código genético. Con 4 nucleótidos en el ARN y 3 por codón, hay 64 codones. Sin embargo, estos 64 codones solo codifican 20 aminoácidos (o 22 si incluye selenocisteína y pirrolisina ), por lo que muchos de los aminoácidos están codificados por múltiples codones.

¿Hay alguna hipótesis de por qué solo hay 22 aminoácidos y no 64? ¿Es posible que hubiera 64 (o al menos más de 22) en un momento anterior?

Parece más probable que antes hubiera menos de 16 aminoácidos y los codones fueran 2 nucleótidos. En su forma más antigua, los codones pueden haber sido 1 a 1 con nucleótidos, con tres o cuatro aminoácidos utilizados. La redundancia en el presente código puede simplemente haber permanecido en su lugar después de la extensión de codones de 2 nucleótidos a codones de 3 nucleótidos.
@mgkrebbs ¿Tiene alguna referencia para esa idea? Me parece sumamente improbable. Desde el ARNt hasta el ribosoma, cada parte de la traducción de proteínas parece estar adaptada a codones de triple nucleótido.
@MadScientist, No, esto fue pura especulación de mi parte. De hecho, los mecanismos presentes están altamente orientados a codones de triple nucleótido. Los codones más pequeños solo se habrían producido en el mundo del ARN, antes de que se usara el ADN. El patrón de redundancia en el código es compatible con la idea de 2 nucleótidos, pero también podría explicarse de otras formas, como la presión selectiva para traducciones sinónimas de mutaciones de una sola base.
Una mirada rápida a la literatura no muestra mucho, pero este artículo de revisión muestra que la idea de los codones de dos nucleótidos no es desconocida: "Por lo general, se supone que el código genético primitivo era más simple (por ejemplo, con un codón de dos nucleótidos y menos aminoácidos) y se expandió en el curso de la evolución".
Bueno, unos pocos microbios pueden hacer selenocisteína y pirrolisina aparte de los veinte aminoácidos habituales, y utilizan respectivamente lo que suelen ser los codones de parada "ópalo" y "ámbar" para estos...
Creo que la primera pregunta que debes hacerte es: "¿Por qué 20? ¿Por qué no 2?". Desde mi punto de vista, la naturaleza evoluciona de una solución muy simple a soluciones más especiales. Entonces, 20 es solo una instantánea de la evolución y estamos a punto de ver aún más (si solo vivimos lo suficiente).
@JM selenocisteína no está restringida de ninguna manera a los microbios. De hecho, todos los animales , excepto algunos insectos , codifican selenocisteína.
Recuerda también que hay multitud de aminoácidos no proteinogénicos, como la hidroxiprolina, que sin embargo se encuentran en las proteínas a pesar de no estar codificados en el código genético.
@MadScientist: Ciertas funciones requieren cada uno de estos 20 aminoácidos. Sin embargo, en casos aislados, un subconjunto seleccionado de aminoácidos podría muy bien conducir a una proteína activa.

Respuestas (3)

Brian Hayes escribió un artículo muy interesante desde un punto de vista matemático:

http://www.americanscientist.org/issues/pub/the-invention-of-the-genetic-code

especialmente la sección "La realidad se entromete". Básicamente, la gente había creado razones matemáticas sofisticadas por las que tiene que ser exactamente 20. La naturaleza, siendo naturaleza, no sigue el razonamiento, sino que tiene sus propias ideas. En otras palabras, no había nada especial en el 20. De hecho, parece haber un injerto lento de un aminoácido 21, la selenocisteína, usando el codón UGA. También la pirrolisina se considera la 22. La última sección sugiere que el código originalmente era un doblete, por lo que se codificaba para <16 aminoácidos. Esto puede explicar en parte por qué la tercera base en cada codón no es tan discriminatoria.

Así que tal vez en el año 2002012 alguien preguntará sobre biología.stackexchange por qué solo hay 40 aminoácidos.

No hay evidencia de que se haya "injertado" selenocisteína. De hecho, todo lo contrario, incluso se ha sugerido que "UGA era originalmente un codón para Sec en el mundo anaeróbico, quizás hace dos o tres mil millones de años, y después de la introducción de oxígeno en biosfera, este aminoácido altamente oxidable podría mantenerse solo en organismos anaeróbicos o en sistemas aeróbicos que desarrollaron mecanismos protectores especiales". En todo caso, es la cisteína la que se ha hecho cargo .
@John Smith El enlace está caído. He encontrado otro enlace: bit-player.org/wp-content/extras/bph-publications/… .

La primera posición del anticodón, la posición de "bamboleo", forma menos enlaces de hidrógeno que las dos segundas. Esto significa que la última posición del codón tiene menos potencial de codificación que las dos primeras. La razón es que el anticodón está en la parte inferior del bucle del anticodón del ARNt, por lo que la columna vertebral del ARNt se dobla hacia atrás para emparejarse consigo mismo. Los nucleótidos no mantienen sus bases planas y regulares entre sí.

Aquí hay una imagen del bucle anticodón . En este caso, 5'-CAU-3' es el anticodón para 5'-AUG-3', por lo que sería la C, justo en la parte más pronunciada de la curvatura del bucle del anticodón, la que se emparejaría peor.

Aquí hay un modelo interactivo en el que puede girar el tRNA/mRNA y ver que no todos los enlaces de hidrógeno tienen la misma longitud, ni todas las bases son coplanares.

No estoy convencido de que sea tanto una causa como una consecuencia de la redundancia. Podría ser que las células antes tuvieran un número menor de aa (<16), que luego podrían codificarse con solo 2 nucleótidos. Cuando un nuevo aa entró en el juego, se desarrolló un sistema triple, pero esto introdujo una redundancia (no dañina) en el código, lo que no ejerció ninguna presión selectiva para tener un vínculo fuerte en la 3ra posición.
El primer enlace está muerto.

Hay otras dos ideas para incluir aquí.

1) solo para agregar a la respuesta reflexiva de KAM. También se pensó que la última base también brinda mucha flexibilidad para el contenido de GC que responde a algunos

2) no olvidemos que la redundancia en el código genético ayuda a dar cierta resistencia a las mutaciones que pueden ser perjudiciales. los aminoácidos menos perjudiciales para un pliegue típico de proteína son más comunes en el código. (Tenemos una idea de esto al estudiar mutaciones de estructuras de proteínas).

3) algunos bioquímicos han propuesto que existe la sensación de que los 20 aminoácidos que tenemos son un conjunto bastante estable, que agregar otros aminoácidos no ayuda a crear mejores proteínas. Peter Schultz aprendió algo de esto ya que su grupo realmente quería agregar aminoácidos extra sintetizados por humanos a las proteínas nativas. Estuve en una charla en la que señaló que los intentos de hacer cisteína con una cadena lateral más larga causaron que el aminoácido se ciclara para formar una tiolactona.

Pensando de esta manera, agregar otro grupo CH 2 a la prolina podría no mejorar el empaque. Probablemente haya algún valor, pero no lo suficiente como para interrumpir toda la maquinaria sensible para hacer y realizar el código genético.

Tal vez quiera decir "tiolactona", no "sulfolactona" (que es un tipo diferente de grupo químico que uno realmente no puede formar con homólogos de cisteína). Hay un grupo mercapto en la cisteína y (posibles) homólogos con los que podría reaccionar el grupo carboxilo, si el aminoácido no está en forma zwitteriónica. Con la cisteína, los factores cinéticos y termodinámicos desfavorecen en gran medida la ciclación a un anillo de cuatro miembros. Los análogos de cuatro y cinco carbonos pueden ciclarse respectivamente en anillos de cinco y seis miembros, y son cinéticamente fáciles de hacer.
gracias, arreglado -ha pasado un tiempo desde que hice química orgánica.