Me di cuenta de que en todos los casos de anotaciones "RefSeq Genes" de hg19 miraba las transcripciones empalmadas que comenzaban (y terminaban) con un exón. De la anotación no hay evidencia de ninguna secuencia aguas arriba o aguas abajo de estos exones que permanezcan en el ARN naciente.
¿Refleja esto la biología o es solo una consecuencia del mapeo de lectura empalmado? En otras palabras: ¿Existen regiones transcritas aguas arriba del primer exón y aguas abajo del último exón en el ARN naciente?
Estas regiones, si existen, no pueden llamarse intrones cuando se definen como 'secuencias empalmadas entre exones'. ¿Cómo los llamaría uno?
La mayoría (casi todos, AFAIK) mRNAs y lncRNAs comienzan con exones por las razones ya mencionadas por David. En un evento de empalme típico, el nucleótido que está a 5' del sitio donante de empalme (llamémoslo pre-donante) y el que está a 3' del sitio aceptor (llamémoslo posaceptor) se unen y la secuencia intrónica entre ellos se elimina.
Si observa detenidamente el mecanismo, notará que el donante previo (es decir, el extremo 3' del primer exón) produce un ataque nucleofílico en el fósforo del aceptor posterior (es decir, el extremo 5' del segundo exón) lo que conduce a la liberación del intrón.
Imagen cortesía : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html
Por lo tanto, siempre hay un exón que precede a un intrón en la transcripción.
Sin embargo, el procesamiento del ARN puede ocurrir a través de un mecanismo diferente en el que los extremos simplemente se cortan. Esto sucede en el procesamiento de tRNA, donde RNAseP corta una porción 5 'a la región de tRNA madura, llamada secuencia líder (ver la figura a continuación). No estoy al tanto de que tal mecanismo ocurra en el caso de los ARNm, pero ciertamente existe una posibilidad. Una posible razón por la que los ARNm no tienen este tipo de mecanismo es porque su extremo 5' está protegido (co-transcripcionalmente) y la escisión del 5' conduciría a la pérdida de la protección y la desestabilización del ARNm (sin embargo, todas son conjeturas). De manera similar, el 3' de los ARNm está poliadenilado, lo que también les otorga estabilidad. Muchos lncRNA también están protegidos y poliadenilados, pero hay excepciones (también los mRNA).
Dado que este mecanismo no es muy común, no existe un nombre sistemático para los extremos extirpados. Para el caso de tRNA, simplemente se denomina secuencia "líder".
Imagen cortesía : Leigh & Lang, 2004
Que yo sepa, las transcripciones siempre comienzan y terminan con exones. Las razones por las que no esperaría lo contrario (aparte de mis observaciones al examinar las transcripciones de Drosophila) se dan a continuación.
Como sabrá, el spliceosoma (al menos para el ARNm) es un complejo proteico ribonuclear multicomponente muy sofisticado y tiene funciones tanto para separar el intrón como para ligar los extremos del exón. El siguiente diagrama, de una revisión reciente , sugiere que el reconocimiento de los sitios de empalme también involucra al exón.
Y los autores escriben (cursivas mías):
"El emparejamiento de bases entre el extremo 50 del snRNA U1 y los primeros seis nucleótidos del intrón, y hasta tres nucleótidos del exón , proporciona la principal fuerza impulsora para el reconocimiento de secuencias específicas".
Así que creo que la maquinaria contemporánea para eliminar los intrones de ARNm requiere que el ARNm del exón "se apodere de".
Si tal eliminación de intrones pudiera tener un propósito funcional, se imaginaría que la maquinaria habría evolucionado para adaptarse a tales situaciones, pero si la función principal de los intrones es permitir el empalme diferencial de exones que especifican regiones de la proteína, los intrones al final de un El ARNm no tendría ningún propósito.
Otro punto a considerar es el sitio de unión de la ARN-polimerasa en el ADN (el promotor extenso y complejo). Si los intrones surgieron originalmente como elementos móviles (algo sugerido por los autores de la revisión), entonces una inserción en el extremo 5' probablemente habría inactivado al promotor, por lo que no se habría producido ninguna transcripción.
Por supuesto, la Naturaleza está llena de excepciones, y sería una tontería excluir que existan intrones del tipo que postulas (en alguna galaxia lejana...).
Gracias por una gran pregunta.
Me gustaría empezar aclarando alguna terminología.
Primero, el ARN naciente se refiere a una molécula de ARN que actualmente se está transcribiendo y no ha sido procesada. El procesamiento puede incluir el corte y empalme de los intrones o la poliadenilación en el extremo 3', por ejemplo. El ARN maduro se empalma (típicamente) y se poliadenila.
En segundo lugar, la definición de consenso actual de un exón es una región transcrita del genoma cuya secuencia se puede encontrar en especies de ARN maduras. Es importante destacar que hay dos clases de exones: exones no codificantes y exones codificadores de proteínas. Creo que puede haberlos confundido y he incluido una imagen para ayudar a aclarar la distinción entre intrones, exones codificantes y exones no codificantes, usando el gen GAPDH humano como ejemplo.
En la figura, los cuadros azules sólidos representan exones, que están presentes en el ARNm maduro . Estos exones pueden contener tanto secuencias codificantes como no codificantes de proteínas, como mencioné. Por ejemplo, el exón 1 de GAPDH contiene solo información no codificante que pertenece a la región no traducida (UTR) 5', mientras que el exón 2 contiene información de secuencia codificante y no codificante.
Cuando ve la anotación RefSeq, está viendo todos los exones (codificadores y no codificantes). Para algunos de los genes, como GAPDH, el primer exón será no codificante. Otros genes pueden comenzar con un exón de codificación (todavía tengo que encontrar uno y dado que el 5'UTR está involucrado en la unión del ribosoma , dudo que existan muchos ejemplos).
Las regiones de una molécula de ARNm más allá de su secuencia de codificación se denominan regiones no traducidas (UTR) 5' y 3'.
Espero que esto ayude a responder a su pregunta.
Vance L Albaugh
Científico fallido
Señor Jemine
David
Señor Jemine
David