¿Por qué hay seis marcos de lectura si solo se hace referencia a una cadena de ADN como la "cadena de codificación"?

Necesitamos considerar seis marcos de lectura al considerar el potencial del ADN para codificar proteínas (tres marcos para cada hebra). Pero solo una hebra se transcribe en ARN, la llamada hebra codificante . Por lo tanto, me parece que en realidad solo hay que considerar tres marcos de lectura. ¿Por qué, entonces, la gente se refiere a seis?

Otro punto relacionado con los marcos de lectura es la definición de marco de lectura abierto - ORF . Un texto define ORF como:

“Un ORF es un tramo continuo de codones que comienza con un codón de inicio (generalmente AUG) y termina con un codón de terminación”

mientras que otro texto lo define como

“Un ORF es un tramo continuo de codones que no contienen un codón de terminación (generalmente UAA, UAG o UGA)”

Me parece que la primera definición es correcta. ¿Cuál es la definición generalmente aceptada para ORF?

He editado su pregunta, no solo para corregir el inglés, sino para aclararla. En cierto modo, lo he configurado para que pueda proporcionar una respuesta (cuando tenga un momento) que señale la fuente de la confusión (no solo la tuya, sino también la de los demás). Sin embargo, creo que esto es justo. También mejoré la presentación de las dos definiciones alternativas de marco de lectura abierto (debe haber definido la abreviatura, ORF, la primera vez que la usó). Veo por qué lo hizo, pero en general no debe hacer dos preguntas en uno, porque puede llevar a que se acepte una respuesta que no responda bien a ambas partes.

Respuestas (2)

La cadena de codificación se refiere a la cadena de ADN con el mismo orden de bases que la transcripción de ARN para un gen en particular . Como un gen siempre está completamente presente en una sola cadena de ADN, de hecho hay 3 marcos de lectura posibles en esta cadena, y solo 1 contiene la secuencia de codón correcta para este gen.

Sin embargo, cuando vemos un genoma completo, es completamente posible que un gen esté presente en una hebra con otro gen presente en la otra, lo que significa que la hebra codificante de un gen es la hebra no codificante del otro. Esta es la razón por la que hay 6 marcos de lectura posibles para el genoma en su conjunto, ya que ambas cadenas pueden (y contienen) genes.

En cuanto al ORF, ambas definiciones parecen estar en uso . En el contexto de tratar de descubrir genes buscando ORF largos, la primera definición es probablemente más útil, ya que seguir la segunda definición podría conducir a una gran cantidad de genes predichos erróneamente (por ejemplo, una secuencia libre de codones de parada larga que no tiene codones de inicio cualquiera de los dos se consideraría un gen posible aunque eso debería ser imposible).

Gracias Koen. Su media sobre la primera pregunta es que algunos genes (¿genes codificantes? No estoy seguro) están ubicados en la hebra no codificante, ¿sí? ¿Podría decirme algún gen de ejemplo?
@Mary No es que los genes estén en la "hebra no codificante", es que cualquiera de los dos soportes puede ser una hebra codificante. Imagine un libro dispuesto así: en todas las páginas de la derecha, el texto se imprime de forma normal, pero en las páginas de la izquierda, se imprime un texto diferente y no relacionado al revés. Considerarías que ese lado es el "lado que no lee". ¡Pero he aquí! gire el libro 180 grados y ahora, de repente, el "lado que no lee" es el lado de lectura y viceversa. Ambos hilos pueden ser hilos de codificación, pero hay que leerlos en la dirección opuesta .
@KoenvdH: creo que tu respuesta es correcta. La razón por la que publiqué uno propio fue para centrarme en lo que creo que son las causas de la confusión. Es un intento de dar un contexto histórico, lo cual puedo hacer debido a mi, eh, historia.
@David Hah Creo que su respuesta es mucho mejor para aclarar la confusión terminológica.

En mi opinión esta pregunta refleja dos cosas:

  1. La dificultad que tienen los estudiantes para apreciar las preocupaciones experimentales históricas de los investigadores en un área que ahora se comprende bien y, por lo tanto, cómo influyó en la acuñación de nuevos términos técnicos.
  2. La forma en que el uso de los términos ha cambiado con el tiempo a medida que desaparecen las viejas preocupaciones y surgen otras nuevas. Así, un término utilizado originalmente en un sentido puede haber sido adoptado posteriormente para significar otro, incluso si esto no parece estrictamente lógico.

¿Qué es una cadena de codificación?

Este es el quid de la primera pregunta, y la respuesta es que el término 'hebra de codificación' no significa nada (o al menos es ambiguo) sin contexto. Por lo tanto, creo que el cartel asume un contexto de genoma , y ​​esta es la falacia de su argumento.

Si uno habla (o piensa) acerca de la 'hebra codificante' de un genoma de ADN, está suponiendo que debido a que muchos genomas de ADN son de doble hebra, si separa las dos hebras (por ejemplo, de un pequeño virus de ADN) y realiza una traducción conceptual (descifró el ADN en aminoácidos utilizando un código genético con T en lugar de U) una hebra tendría toda la información de los genes y la otra no tendría ninguna. Otra forma de decir esto es que está asumiendo que todos los genes en el genoma tienen la misma direccionalidad (dirección de la flecha en un diagrama del genoma, como el de E. coli , a continuación). Este casi nunca es el caso. (Los únicos ejemplos que se me ocurren son los genomas de virus de ARN monocatenario).

Sección del genoma de E.coli

Entonces, si usa el término 'cadena de codificación', debe indicar que esto está en el contexto de un solo gen . Cada hebra de ADN en un genoma (por ejemplo, E.coli ) contendrá secciones de ADN que codifican y algunas que no codifican en términos de traducción conceptual. (Si observa los artículos que describen aislamientos tempranos de genes, encontrará las palabras "cadena de codificación" generalmente calificadas como "del gen"

Pero el ADNc tiene solo una hebra de codificación...

Históricamente, una de las preocupaciones era secuenciar ADNc eucarióticos, copias de ADN de ARNm. Estos serían monocistrónicos, es decir, codificarían una única proteína. Así que aquí una hebra sería codificada y la otra no codificada. ¿Era posible reducir a tres el número de marcos de lectura que era necesario analizar en este caso? ¡No! El hecho de que solo una cadena esté codificando no ayudó en absoluto, ya que no había forma de saber cuál era en el ADNc que se estaba secuenciando. Lo mismo ocurre con el fragmento de cualquier gen. Habías secuenciado un trozo de ADN, clonado en algún vector plásmido y no había forma de saber de qué hebra se originó la secuencia que leíste. Por lo tanto, debe traducirlo en los seis marcos de lectura para encontrar posibles secuencias de aminoácidos.

Entonces, ¿qué es un marco de lectura abierto?

Marco de lectura abierto es un término que a menudo se usa hoy en día de una manera distinta a la forma en que se usó cuando se acuñó. En el momento en que se acuñó, uno estaría secuenciando tramos cortos de cDNA o virus o genes bacterianos y había una baja probabilidad de que uno estuviera secuenciando a través del extremo C, es decir, el codón de terminación del gen. La preocupación de uno era concentrarse en los marcos de lectura que no estaban interrumpidos por los codones de parada. Este uso original se refleja en la definición de marco de lectura abierto en Wikipedia:

“Un ORF es un tramo continuo de codones que no contienen un codón de terminación (generalmente UAA, UAG o UGA)”

Sin embargo, a medida que aumentó el conocimiento y mejoró la tecnología, el enfoque cambió hacia el descubrimiento de genes en las secuencias genómicas parciales largas o genómicas de los organismos. Ahora uno estaba trabajando con largas secuencias de ADN que contenían muchos genes completos. El enfoque se convirtió en encontrar genes potenciales basados ​​en codones de inicio y finalización (y una longitud de corte). Esto se refleja en la documentación del programa EMBOSS, getorf :

“Un ORF puede definirse como una región de un tamaño mínimo especificado entre dos codones de PARADA, o entre un codón de INICIO y uno de PARADA”.

Tenga en cuenta que incluso esta última definición es ambigua.

¿Cual es correcta? Esa es una preocupación de los estudiantes. En el mundo real uno debe reconocer que el significado de las expresiones puede cambiar. Si hay alguna ambigüedad, como aquí, uno debe definir la forma en que está utilizando la expresión .