¿Las transcripciones siempre comienzan y terminan con exones?

Me di cuenta de que en todos los casos de anotaciones "RefSeq Genes" de hg19 miraba las transcripciones empalmadas que comenzaban (y terminaban) con un exón. De la anotación no hay evidencia de ninguna secuencia aguas arriba o aguas abajo de estos exones que permanezcan en el ARN naciente.

¿Refleja esto la biología o es solo una consecuencia del mapeo de lectura empalmado? En otras palabras: ¿Existen regiones transcritas aguas arriba del primer exón y aguas abajo del último exón en el ARN naciente?

Estas regiones, si existen, no pueden llamarse intrones cuando se definen como 'secuencias empalmadas entre exones'. ¿Cómo los llamaría uno?

Bienvenido a BiologySE... Estoy de acuerdo con lo que dice al final (es decir, "Supongo que si tiene una respuesta para 1 y 2..." - Limitaría su pregunta para obtener una respuesta (es más fácil responder una simple , pregunta sencilla en lugar de una pregunta amplia con 5 subpreguntas). Siempre puede hacer más preguntas: cuanto más específicas, mejor
¡Muy buena (y bien investigada) pregunta! espero respuestas por aqui
@TalhaIrfan Gracias. Condensé el texto a las preguntas básicas.
¿Podría explicar qué quiere decir con "mapeo de lectura empalmado" por favor?
@David, el mapeo de lectura empalmado se refiere al mapeo de secuencias empalmadas (por ejemplo, lecturas de secuencias derivadas de ARN) a una referencia no empalmada (ADN del genoma de referencia). El algoritmo que realiza este tipo de tarea tiene que ser capaz de aceptar inserciones largas en la secuencia de referencia sin penalizarlas como desajustes en la alineación. Estas inserciones de lectura a referencia (o eliminaciones de referencia a lectura) son intrones.
@Herr Jemine - Ya veo. Gracias por la explicación.

Respuestas (3)

La mayoría (casi todos, AFAIK) mRNAs y lncRNAs comienzan con exones por las razones ya mencionadas por David. En un evento de empalme típico, el nucleótido que está a 5' del sitio donante de empalme (llamémoslo pre-donante) y el que está a 3' del sitio aceptor (llamémoslo posaceptor) se unen y la secuencia intrónica entre ellos se elimina.

Si observa detenidamente el mecanismo, notará que el donante previo (es decir, el extremo 3' del primer exón) produce un ataque nucleofílico en el fósforo del aceptor posterior (es decir, el extremo 5' del segundo exón) lo que conduce a la liberación del intrón.

ingrese la descripción de la imagen aquí Imagen cortesía : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html

Por lo tanto, siempre hay un exón que precede a un intrón en la transcripción.

Sin embargo, el procesamiento del ARN puede ocurrir a través de un mecanismo diferente en el que los extremos simplemente se cortan. Esto sucede en el procesamiento de tRNA, donde RNAseP corta una porción 5 'a la región de tRNA madura, llamada secuencia líder (ver la figura a continuación). No estoy al tanto de que tal mecanismo ocurra en el caso de los ARNm, pero ciertamente existe una posibilidad. Una posible razón por la que los ARNm no tienen este tipo de mecanismo es porque su extremo 5' está protegido (co-transcripcionalmente) y la escisión del 5' conduciría a la pérdida de la protección y la desestabilización del ARNm (sin embargo, todas son conjeturas). De manera similar, el 3' de los ARNm está poliadenilado, lo que también les otorga estabilidad. Muchos lncRNA también están protegidos y poliadenilados, pero hay excepciones (también los mRNA).

Dado que este mecanismo no es muy común, no existe un nombre sistemático para los extremos extirpados. Para el caso de tRNA, simplemente se denomina secuencia "líder".

ingrese la descripción de la imagen aquí Imagen cortesía : Leigh & Lang, 2004

Gracias por tu detallada explicación. Como David y usted señalan, es muy poco probable que el mecanismo de empalme pueda eliminar secuencias aguas arriba y aguas abajo del primer y último exón, respectivamente. Otro indicio importante es que el procesamiento de 5' CAP ocurre co-trancripcionalmente. Esto, y el hecho de que se usa un método llamado 'CAGE' para identificar las regiones promotoras mediante la secuenciación específica de CAP de los extremos 5' del ARNm da cierta confianza en que es probable que la eliminación en 5' de una 'secuencia previa al exón' no ocurra en 5'. ARNm tapado. Sin embargo, no hemos discutido el extremo 3'.
@HerrJemine Realmente no sé por qué eso no es común. Incluso para la parte de 5 'esto fue solo una suposición descabellada. No lo tomes como un hecho. Por cierto, el extremo 3' tiene poli-A, que también es fundamental para la estabilidad del ARN. Sin embargo, un ARN también puede ser estable en ausencia de tapa y cola poli-A. Dado que estos casos también son muy pocos, podemos suponer que esto podría ser un factor para la baja ocurrencia de corte final en los ARN.
Encontré alguna pista sobre el truncamiento del extremo 3 'postranscripcional en la poliadenilación alternativa en wikipedia (segundo párrafo de la introducción y la sección 'Poliadenilación alternativa'). Le sugiero que agregue este aspecto a su respuesta y lo aceptaré.

Que yo sepa, las transcripciones siempre comienzan y terminan con exones. Las razones por las que no esperaría lo contrario (aparte de mis observaciones al examinar las transcripciones de Drosophila) se dan a continuación.

Como sabrá, el spliceosoma (al menos para el ARNm) es un complejo proteico ribonuclear multicomponente muy sofisticado y tiene funciones tanto para separar el intrón como para ligar los extremos del exón. El siguiente diagrama, de una revisión reciente , sugiere que el reconocimiento de los sitios de empalme también involucra al exón.

Parte de la Fig. 4 de TIBS (2016) vol 41 pp 33-45

Y los autores escriben (cursivas mías):

"El emparejamiento de bases entre el extremo 50 del snRNA U1 y los primeros seis nucleótidos del intrón, y hasta tres nucleótidos del exón , proporciona la principal fuerza impulsora para el reconocimiento de secuencias específicas".

Así que creo que la maquinaria contemporánea para eliminar los intrones de ARNm requiere que el ARNm del exón "se apodere de".

Si tal eliminación de intrones pudiera tener un propósito funcional, se imaginaría que la maquinaria habría evolucionado para adaptarse a tales situaciones, pero si la función principal de los intrones es permitir el empalme diferencial de exones que especifican regiones de la proteína, los intrones al final de un El ARNm no tendría ningún propósito.

Otro punto a considerar es el sitio de unión de la ARN-polimerasa en el ADN (el promotor extenso y complejo). Si los intrones surgieron originalmente como elementos móviles (algo sugerido por los autores de la revisión), entonces una inserción en el extremo 5' probablemente habría inactivado al promotor, por lo que no se habría producido ninguna transcripción.

Por supuesto, la Naturaleza está llena de excepciones, y sería una tontería excluir que existan intrones del tipo que postulas (en alguna galaxia lejana...).

Entonces, ¿por qué la rebaja? Si rechaza a alguien, tenga las agallas y la decencia de explicar por qué. ¿Qué tiene de reprobable la idea de que el empalme evolucionó porque permitió variantes de proteínas por empalme diferencial y la maquinaria evolucionó para lidiar con eso? Que aunque hay intrones en las UTR de un ARNm, que tal vez afecten la unión al ribosoma, etc., es probable que estos hayan sido secundarios. Si tiene un complejo que necesita unir dos partes de una cuerda antes de que pueda cortarla y unirla, tiene mucho sentido que no funcione al final. ¿O no te gusta mi último párrafo?
No voté a la baja, pero supongo que la naturaleza teórica y sin fuente de esta respuesta jugaría un papel importante. Además, me parece extraño que le pidas a alguien que explique su voto negativo de una manera tan defensiva.
@MarchHo No le dispararé al mensajero, pero cuando vota negativamente, se le solicita que haga un comentario. Es muy molesto proporcionar una respuesta basada en la estructura a una pregunta teórica (más hipotética) y terminar con -1, por lo que un visitante casual asumiría algo básicamente incorrecto con su respuesta. Mi conjetura ahora es que la referencia autocrítica y caprichosa de Star Wars se malinterpretó como un ataque a la pregunta. Tal vez lo cambie a Shakespeare cuando agregue una imagen del empalmeosoma más tarde para aclarar mi argumento.
Su respuesta toca el punto, pero una pequeña explicación y algunos diagramas lo mejorarían.
@David Gracias por la respuesta a mi pregunta. Me gusta que hayas señalado la diferencia estructural entre un empalme entre exones y una posible eliminación de secuencias aguas arriba y aguas abajo sin un 'compañero de empalme'. Por cierto, tampoco voté a favor, pero mi voto a favor aún no contó (exp. faltante).
@WYSIWYG: agregué un diagrama apropiado y endurecí el argumento. No cambié a Shakespeare, pero la cita que tenía en mente era "Hay más cosas en el cielo y en la tierra...". Por ejemplo, Nature de esta semana informa que se ha encontrado N6-metiladenina en eucariotas donde se pensaba que no existía. Nunca digas nunca.
@David gracias. Ya te he dado un +1. Entiendo que hay muchos mecanismos desconocidos (y sí, también había visto ese artículo), pero creo que posiblemente podamos justificar por qué son raros.
@David solo como punto de aclaración, los usuarios no tienen obligación alguna de explicar o "justificar" sus votos, hacia arriba o hacia abajo. El mensaje al que te refieres aparece para los usuarios casuales o de poca reputación de un sitio, pero no para los usuarios más experimentados, que teóricamente entienden las pautas de votación. También quisiera señalar, como lo hizo March Ho, que atacar de una manera tan defensiva e insultante no es útil para el tono general del sitio, ni es probable que incite a nadie a explicar o cambiar su voto. Sé amable
@MattDMo Está bien, está bien. Sin embargo, recibí un mensaje de este tipo recientemente y he estado publicando con bastante frecuencia. El mensaje implica que esa es la etiqueta correcta, que los usuarios antiguos deberían haber aprendido. Y por cierto, no considero que mis modales fueran insultantes. Fue contundente y directo, pero no más. Sin embargo, cuando expliqué un voto negativo re. En otra publicación reciente me cortaron la cabeza de un mordisco, así que supongo que uno debería aceptar que las pautas son más honradas en su ruptura.

Gracias por una gran pregunta.

Me gustaría empezar aclarando alguna terminología.

Primero, el ARN naciente se refiere a una molécula de ARN que actualmente se está transcribiendo y no ha sido procesada. El procesamiento puede incluir el corte y empalme de los intrones o la poliadenilación en el extremo 3', por ejemplo. El ARN maduro se empalma (típicamente) y se poliadenila.

En segundo lugar, la definición de consenso actual de un exón es una región transcrita del genoma cuya secuencia se puede encontrar en especies de ARN maduras. Es importante destacar que hay dos clases de exones: exones no codificantes y exones codificadores de proteínas. Creo que puede haberlos confundido y he incluido una imagen para ayudar a aclarar la distinción entre intrones, exones codificantes y exones no codificantes, usando el gen GAPDH humano como ejemplo.

Vista del navegador del genoma UCSC del gen GAPDH humano

En la figura, los cuadros azules sólidos representan exones, que están presentes en el ARNm maduro . Estos exones pueden contener tanto secuencias codificantes como no codificantes de proteínas, como mencioné. Por ejemplo, el exón 1 de GAPDH contiene solo información no codificante que pertenece a la región no traducida (UTR) 5', mientras que el exón 2 contiene información de secuencia codificante y no codificante.

Cuando ve la anotación RefSeq, está viendo todos los exones (codificadores y no codificantes). Para algunos de los genes, como GAPDH, el primer exón será no codificante. Otros genes pueden comenzar con un exón de codificación (todavía tengo que encontrar uno y dado que el 5'UTR está involucrado en la unión del ribosoma , dudo que existan muchos ejemplos).

Las regiones de una molécula de ARNm más allá de su secuencia de codificación se denominan regiones no traducidas (UTR) 5' y 3'.

Espero que esto ayude a responder a su pregunta.

Esto en realidad no responde la pregunta. Creo que el OP sabe sobre exones y UTR. Su pregunta es por qué una transcripción siempre tiene que comenzar con un exón. Tal vez pueda agregar alguna explicación para este punto.
No he oído hablar de una clasificación como exones codificantes y no codificantes. Puede tener exones que tengan una parte del CDS y una parte del UTR.
Gracias por su respuesta. Pero mi pregunta no se refería a si los exones contienen secuencias codificantes o no codificantes. Soy consciente del hecho de que los exones pueden ser parte de la UTR 5' o 3' en el ARNm maduro y también que hay ARN no codificantes en general. Como señaló @WYSIWYG, me gustaría saber si el ARN naciente sin procesar siempre comienza y termina con un exón o si podría ser una eliminación de las secuencias de ARN de 'cabeza' y 'cola' que se transcribieron del ADN.
@WYSIWYG Gracias por tu comentario. Tal vez la codificación frente a la no codificación esté restringida a ciertos círculos de bioinformática, que es donde encontré el término. Creo que la convención UTR de 5'/3' es más intuitiva.
@HerrJemine Gracias por aclarar sus necesidades específicas. Como alguien señaló anteriormente, solo un subconjunto muy limitado de ARN se escinde en el extremo 5 'posteriormente a la transcripción (no pude encontrar ningún ejemplo de ARN de mamífero que se escinda en el extremo 3'). Puede estar interesado en explorar una técnica llamada NET-seq link . Demuestra una transcripción generalizada fuera de la unidad transcripcional en levaduras, moscas y humanos.