Diferencia entre CDS y ADNc

¿Cuál es la diferencia entre las secuencias de codificación (CDS) y el ADNc?

¿Las secuencias de codificación son las secuencias que se transcriben a ARNm y ADNc en contraste con el ADN obtenido por polimerización inversa de ARNm maduro?

Respuestas (2)

La diferencia se reduce a Regiones no traducidas . Un CDS o secuencia de codificación es la parte de una transcripción que en realidad se traduce en proteína. Por lo tanto, un CDS (casi) siempre comenzará con un codón AUG y se detendrá en uno de los tres codones STOP (UAA,UGA,UAG).

Sin embargo, la transcripción (tenga en cuenta que me refiero a transcripciones maduras que ya se han empalmado, por lo que se han eliminado los intrones) también contendrá los UTR que en realidad no se traducen en proteína. Una secuencia de ADNc se deriva del transcrito por transcripción inversa y, por lo tanto, también contendrá las UTR 5' y 3'. Por ejemplo, vea este diagrama esquemático de una transcripción no empalmada:

ingrese la descripción de la imagen aquí

El CDS del gen representado en la imagen de arriba solo contendrá el ATG, el STOP y las dos regiones verdes (exones). El cDNA contendrá todo eso y, además, las dos UTR. Por supuesto, tanto el ADNc como el CDS no contendrán los intrones.

En realidad, los exones incluyen 5'UTR, CDS y 3'UTR. Y CDS no debe incluir el codón STOP ya que no se traduce en un aminoácido. Su diagrama no es muy preciso con el lugar donde dibuja el Exón 1 y el Exón 2.
@olala es solo un diagrama simple para ilustrar la existencia de UTR. Sí, por supuesto que son exónicos, pero eso no es realmente relevante aquí. En cuanto al CDS, no, también incluye el codón de parada. Primero porque las paradas son reconocidas por ARNt específicos, como cualquier otro codón, y porque esa es la convención en el campo. Ver, por ejemplo, el CDS descrito aquí: p53.iarc.fr/p53Sequence.aspx
Tengo que estar en desacuerdo con CDS y detener el codón. Si observa las anotaciones en formato GTF, enumeraron el codón de parada por separado de CDS, vea un ejemplo de esta publicación en la parte inferior de la página: mblab.wustl.edu/GTF22.html , también vea la respuesta de esta publicación Istvan biostars.org/ p/65162

La definición de secuencia de codificación es, en mi opinión, un poco confusa. En realidad, es la secuencia de ADN en el gen que tiene la misma secuencia que el ARNm correspondiente (excepto que tiene T en lugar de U). Ahora, a menudo verá definiciones que dicen que la secuencia de codificación es el ADN que se transcribe , pero esto no es realmente correcto porque durante la transcripción, la ARN polimerasa en realidad copia (transcribe) la otra hebra del ADN (es decir, la que está complementaria a la secuencia codificante). Y yo iría un paso más allá y diría que la secuencia de codificación excluye los intrones. También puede referirse a la hebra de codificacióndel ADN, para abarcar toda la unidad transcripcional, incluidos los intrones, como una forma de referirse a la hebra que lleva la secuencia codificante.

Tiene razón en su definición de cDNA (excepto su transcripción inversa, no polimerización inversa). La secuencia de ADNc de longitud completa para un gen que codifica una proteína abarcará el CDS pero, como señala @terdon en su comentario, también incluirá regiones no traducidas en los extremos 5' y 3'.

Entonces, ¿cuál sería la diferencia en la secuencia de un gen dado entre su CDS y su ADNc?
La secuencia de CDS no es idéntica a la secuencia de ADNc. Ese solo será el caso de genes sin regiones UTR.
Sí, @terdon tiene razón: estoy tan orientado a las proteínas que pasé por alto esto. Entonces, la secuencia de ADNc abarcará el CDS. Agregará una corrección a la respuesta.