En muchas bases de datos, las secuencias de ADN de las proteínas se dan como una cadena de a,t,g,c sin especificar si el comienzo es desde 5' o desde 3'. Tampoco se especifica si se trata de la hebra codificante o no codificante.
¿Es porque todas las secuencias están escritas desde 5' hasta 3' de la hebra codificante solamente?
Direccionalidad
De hecho, es una convención representar las secuencias de ácidos nucleicos en la dirección 5ʹ a 3ʹ.
Esto está implícito en el documento IUPAC/IUB sobre abreviaturas y símbolos para ácidos nucleicos, polinucleótidos y sus constituyentes , aunque no se establece explícitamente, presumiblemente porque fue escrito en 1974, antes de que se establecieran las grandes bases de datos de ácidos nucleicos.
Hebra
En general , no puede suponer nada sobre en qué hebra se encuentra una característica particular. Debe consultar el contexto o la documentación de la base de datos particular que está utilizando.
Prefiero el término 'cadena de sentido' a 'cadena de codificación' como se explica en otra publicación . Sin embargo, esto solo tiene significado en un conjunto restringido de circunstancias relacionadas con el ARNm, particularmente considerando las copias de ADNc de los ARNm eucarióticos. Solo si el contexto indica que este es el caso, puede suponer que la hebra se presenta como una 'hebra de sentido'.
El problema surge del hecho de que para todos (o casi todos) los genomas, los diferentes genes están ubicados en diferentes hebras del ADN: el cromosoma no tiene una "hebra con sentido" o una "hebra codificante" única . Así, para secuencias de ADN en una base de datos como Genbank , es posible lo siguiente:
Se proporciona un ejemplo de esto último en el registro de Sample GenBank, que debe consultarse para comprender la anotación de características en las entradas de secuencias de ADN en GenBank . Esta entrada cromosómica de levadura de 5028 pb codifica dos genes. El primero, AXL2, está anotado:
gene 687..3158 /gene="AXL2"
El segundo, REV7, está anotado:
gene complement(3300..4037) /gene="REV7"
Esto indica que, cuando se presenta en la dirección 5ʹ a 3ʹ, el gen REV7 se encuentra en el complemento de la hebra presentada.
La convención es proporcionar la hebra con sentido de 5' a 3'.
Jaime
Arjun Devdas
siempre confundido