En el pre-ARNm eucariota, tengo algunos problemas para comprender exactamente cómo se define la región no traducida principal 5.
Parece que podría definirse como la diferencia de pre-ARNm entre la transcripción y la traducción, ¿no es así?
Si es así, ¿comienza la transcripción inmediatamente después del final de la secuencia promotora? Inmediatamente después de que termina la región promotora del ADN, ¿el siguiente nucleótido pasa a formar parte de la 5'UTR?
Respuesta concisa
La región 5'-UTR de un ARNm eucariótico se deriva del transcrito de ARN de la región de un gen entre el sitio de inicio de la transcripción y el ADN correspondiente al codón de iniciación de la traducción. Se diferencia de esa región del transcrito inicial en la mayoría de los casos por tener un nucleótido de guanosina modificado agregado en el extremo 5' en una estructura de 'tapa' y, en algunos casos, por carecer de un intrón presente en el primero.
El sitio de inicio transcripcional (TSS) y el promotor
Esta respuesta es en términos de TSS en lugar de 'región promotora' o 'secuencia promotora', favorecida por el interrogador porque en eucariotas, al menos, no existe una secuencia promotora simple y fácilmente definible. Una revisión de 2012 de los promotores de metazoos comienza con la definición: “Los promotores de genes son los loci que se superponen a los sitios de inicio de la transcripción (TSS), en los que la entrada reguladora total de un gen se integra en la tasa de iniciación de la transcripción. El papel inmediato del promotor es unir y posicionar correctamente el complejo de iniciación de la transcripción…”.
A continuación se muestra un diagrama simplificado de algunos componentes de los promotores humanos (adaptado de una revisión anterior de Hahn ). La posición de 'Inr', la caja del iniciador que contiene el TSS, varía con respecto a la caja TATA (generalmente de -25 a -30 en humanos), al igual que su secuencia. Por lo tanto, incluso ignorando los TSS alternativos mencionados por @Luke, no es posible identificar el TSS de manera inequívoca mediante la inspección de la secuencia de ADN de un gen en la forma en que aparentemente desearía el interrogador.
El codón de iniciación traslacional
Debe mencionarse que tampoco es posible identificar inequívocamente el codón de iniciación de la traducción del ARNm mediante la inspección de la secuencia de ADN de un gen. Aunque el 90% o más de los casos siguen la regla de Kozak , de manera que corresponde al primer ATG, en algunos casos puede corresponder al segundo ATG, y en una pequeña minoría —donde se produce iniciación interna— a algún ATG distal. También hay muy pocos ejemplos de iniciación de la traducción en codones distintos de AUG .
Intrones en regiones 5′-UTR de pre-ARNm
Una racionalización común de la naturaleza intrón/exón del pre-ARNm eucariótico es en términos de corte y empalme alternativo para producir diferentes secuencias de proteínas. Quizás debido a esto, a menudo se ignora la presencia de intrones en la transcripción primaria que contiene las UTR 5′ y 3′ (ver Bicknell et al. para una revisión). De hecho, aproximadamente el 35 % de los precursores de 5′-UTR contienen intrones que no están presentes en el ARNm maduro.
5′-taponado de ARNm eucariótico
La gran mayoría de los ARNm eucarióticos tienen un capuchón en su extremo 5′, producido por la adición de un nucleótido de guanosina en un enlace pirofosfato 5′-5′ al residuo 5′ (generalmente A) del pre-ARNm. Este se metila posteriormente en el carbono-7; y también puede ocurrir la 2'-O-metilación de la ribosa de uno o dos nucleótidos subsiguientes.
Nota
Aunque "el ADN hace que el ARN haga proteínas", creo que es importante describir las características de las moléculas de información en términos de su composición real. Por lo tanto, la 5'-UTR debe definirse en términos de ARNm, no de promotores o exones. Si uno hace referencia al contenido de información del ADN o el ARN, entonces creo que se debe usar una forma de palabras para aclararlo. Las formas confusas de las palabras pueden conducir fácilmente a un pensamiento confuso.
Respuesta corta
La UTR 5' del ARNm incluye la secuencia desde el sitio de inicio de la transcripción (TSS) hasta el primer exón. Los promotores suelen estar asociados con un TSS correspondiente.
Respuesta más larga
Al definir una UTR, debemos considerar dónde comienza la transcripción. Estrictamente hablando, la transcripción comienza en el sitio de inicio transcripcional (TSS). Un sitio web útil para las definiciones exactas de términos como este es Sequence Ontology - vea aquí la definición de TSS ( enlace ) - aunque en este caso no proporciona más información que eso (es decir, el TSS es donde comienza la transcripción... que podríamos haber deducido del nombre). TSS tendrá una región promotora asociada, que es donde se unen la ARN polimerasa (y varios reguladores y factores de transcripción).
Para ampliar: un gen puede tener múltiples TSS que pueden promoverse en diferentes circunstancias (p. ej., con diferentes factores presentes). Por lo tanto, tenemos el concepto de una región TSS "La región de un gen desde el 5' más TSS hasta el 3' TSS" ( enlace ). Los TSS deben determinarse empíricamente y parecen variar según el tejido (una base de datos de todos los TSS conocidos ha estado acumulando evidencia desde 2002: DBTSS ). Acabo de realizar una búsqueda del gen APOE (chr 19) y este es un pequeño extracto de los datos presentados, solo para dar una idea:
De DBTSS
Por lo tanto, el TSS para un gen depende del contexto de cuándo/dónde se produce la transcripción.
Al buscar más información, encontré un artículo que describe la 5'UTR en el ARNm , que no es necesariamente una copia exacta del ADN genómico (p. ej., mediante la adición de la tapa). Aquí está el párrafo y el diagrama correspondientes, que lo explican mejor de lo que puedo parafrasear (resaltado por mí):
El control transcripcional está mediado por factores de transcripción, ARN polimerasa y una serie de elementos que actúan en cis ubicados en el ADN, como promotores, potenciadores, silenciadores y elementos locus-control, organizados en una estructura modular y regula la producción de moléculas de pre-ARNm. , que se someten a varios pasos de procesamiento antes de convertirse en ARNm funcionales. Se eliminan los intrones, se agrega una estructura de caperuza de 7-metil-guanilato (m7G) en el extremo 5' del primer exón, y se añade un tramo de 100-250 residuos de adenina (la cola de poli(A)) en el extremo 3' del último exón, que a su vez se genera mediante la escisión endonucleolítica del transcrito primario. A veces, la secuencia del ARNm también se altera en un proceso llamado edición del ARNm, y la secuencia de codificación resultante del ARN maduro difiere de la secuencia correspondiente en el genoma. El ARNm maduro resultante, en eucariotas, tiene una estructura tripartita que consta de una región no traducida en 5' (UTR 5'), una región codificante formada por codones triples que codifican cada uno un aminoácido y una región no traducida en 3' (UTR 3') . La Figura 1 muestra estas y otras características de los ARNm.
Figura 1: La estructura genérica de un ARNm eucariótico, que ilustra algunos elementos reguladores postranscripcionales que afectan la expresión génica. Abreviaturas (de 5' a 3'): UTR, región no traducida; m7G, casquete de 7-metil-guanosina; horquilla, estructuras secundarias en forma de horquilla; uORF, marco de lectura abierto aguas arriba; IRES, sitio interno de entrada al ribosoma; CPE, elemento de poliadenilación citoplasmática; AAAAAA, señal de poliadenilación.
Referencia: Mignone, F., Gissi, C., Liuni, S. y Pesole, G. (2002). Regiones no traducidas de ARNm. Biología del genoma, 3(3). http://www.ncbi.nlm.nih.gov/pubmed/11897027
Promotores
Para concluir mi respuesta (disculpas por su falta de brevedad), existen diferentes tipos de promotores, no todos los cuales incluyen directamente un TSS, pero la mayoría de los promotores se denominan "Promotores principales" e incluyen el TSS (además del ARN sitio de unión de la polimerasa y otros sitios de unión del factor de transcripción).
La UTR es la región del transcrito aguas arriba de la metionina inicial. El promotor no se transcribe en sí mismo.
WYSIWYG