Dar sentido a la representación visual de la transcripción

La mayoría de la gente está familiarizada con el siguiente diagrama. Algún ADN genómico con una región promotora, exones e intrones. Esto se transcribe en ARN que luego se traduce en un polipéptido.

Dogma central

Cuando miramos más de cerca la hebra que se está transcribiendo, podemos distinguir entre las dos como hebras sentido y antisentido.

transcripción

Entonces, los factores de transcripción y la ARN polimerasa se unen y comienzan a transcribir el ARNm en la dirección 5 'a 3' y, por lo tanto, leen la cadena antisentido en la dirección 3' a 5' y tienen la misma secuencia que la cadena de ADN sentido, sustituyendo U por T en el ARNm.

ingrese la descripción de la imagen aquí

Mi pregunta sería, ¿no deberían numerarse los exones en el orden inverso como se muestra en la primera imagen que proporcioné? Entonces, en lugar de Promotor -> Exón 1 -> Intrón -> Exón 2, ¿debería ser Promotor -> Exón N -> Intrón -> Exón N-1?

Además, en los sitios bioinformáticos, ¿las secuencias de genes se enumeran en la cadena sentido o antisentido? He notado que en algunas herramientas bioinformáticas , para determinar qué polipéptido resultará de una secuencia de ADN, se debe ingresar la hebra con sentido en una orientación de 5' a 3' y no la hebra antisentido.

Respuestas (3)

Las secuencias de genes se anotan en la cadena de sentido. Entonces, estos diagramas son correctos.

En el diagrama superior, el inicio ATG está a la izquierda y el codón de terminación está a la derecha. El exón uno es el exón más a la izquierda. Todo eso está correctamente ilustrado. Si busca una secuencia de transcripción en, digamos, conjunto, será de la misma manera, la secuencia de inicio estará al principio, el codón de parada al final. Esa es la convención.

Todas las representaciones visuales y casi todos los sistemas de coordenadas se basan en la hebra sensorial. La maquinaria de la polimerasa no tiene ni idea de lo que tiene sentido y lo que tiene sentido, porque cada uno es el contrario del otro.

Para la representación visual, esto tiene mucho más sentido y transmite más información, ya que elimina la capa de información extra complicada. Y, en la mayoría de los casos, las estructuras de los genes se declaran en el orden del genoma de referencia, que siempre es la cadena positiva o con sentido.

Luego de la parte de bioinformática, la mayoría de sus bases de datos, como UCSC, Ensemble y NCBI, mantienen coordenadas de genes en el genoma de referencia, pero hay una trampa, al informar la información a través de un archivo de cama,

Los genes de cadena negativa se informan según chromosome stop startel NCBI (la última vez que los usé fue hace un año y medio), UCSC proporcionará el chromosome start stopy ambos informarán la desconexión, UCSC espera que usted, el bioinformático, cree el complemento inverso cuando encuentre la información de la cadena. , mientras que NCBI espera que su programa falle en una verificación de cordura porque stop - startserá negativo, lo que implica que no puede cometer un error al analizar los archivos de datos de NCBI. Además, los índices UCSC se mantienen en base 0, mientras que el NCBI se mantiene en base 1.

Le insto a que valide esta información.

Pero, ¿por qué no mantener también un hilo negativo? mientras mantiene las coordenadas del gen y los elementos para el antisentido en el formato que acaba de mencionar.

Debido a que hablando desde un punto de vista computacional tiene más sentido, este sistema consumiría más almacenamiento (recuerde que todo el sistema se formuló antes de que el almacenamiento fuera tan barato como lo es hoy) consumiría más memoria durante las tareas (exactamente el doble de lo que está consumiendo hoy). Así que es mejor tener un genoma de referencia de cadena positiva y todos los genes y elementos basados ​​en eso.

Solo un ejemplo de cómo funciona la alineación de las lecturas de secuencia,

  1. Alineas tu lectura con el genoma de referencia
  2. ¿Alinea? En caso afirmativo, se ha asignado a la hebra positiva
  3. ¿No? Invertir complementar la lectura y alinear de nuevo
  4. ¿Alinea? En caso afirmativo, se ha asignado a la hebra negativa.
  5. ¿No? Posiblemente una lectura errónea u otros artefactos.
GTF/GFF3tiene el start stoporden junto con la orientación del hilo. Creo que esto se ha convertido más o menos en un formato estándar para las anotaciones de todos los repositorios.