Por lo que sé, múltiples hebras de ADN forman un gen, entonces, ¿cómo puede haber solo un ARN correspondiente a cada gen y viceversa? ¿Mi conocimiento es incorrecto?
Muy pocas cosas son tan claras en biología. Hay tres cosas principales a considerar aquí.
La mayoría de los genes eucarióticos están empalmados . Este es básicamente un proceso mediante el cual un solo gen se puede transcribir en múltiples ARNm diferentes, cada uno de los cuales se traducirá a una proteína diferente.
Por lo tanto, por lo general (algunos genes no se empalman) no existe una correspondencia uno a uno entre un gen y los ARNm que puede producir.
El siguiente problema es que algunos genes existen en múltiples copias similares en el genoma. Para tales genes, no siempre es posible saber cuál de los duplicados se leyó realmente para producir un ARNm dado.
Por lo tanto, no siempre existe una correspondencia biunívoca directa entre un ARNm y el gen del que se transcribió. Sin embargo, esto es mucho menos común que el problema de empalme mencionado anteriormente y, en la mayoría de los casos, puede ignorarse.
Cada gen está solo en una sola hebra de ADN. Sí, el ADN es de doble cadena, pero cada gen reside en solo una de las dos cadenas (la otra cadena será el complemento inverso del gen).
A pesar de los puntos mencionados anteriormente, por lo general es posible mapear una molécula de ARNm al gen que la produjo. En el caso de genes duplicados, solo obtendrá múltiples resultados. Los programas que existen para hacer este tipo de análisis pueden manejar principalmente el empalme. Entonces, por ejemplo, si tiene la secuencia del cromosoma humano 21 y la secuencia de ARNm del gen ERG, puede hacer (en un sistema * nix con exonerate
instalado):
exonerate -m coding2genome -t chr21.fasta -q dscam.fasta > out
Que producirá:
Command line: [exonerate -m est2genome -n 1 -t chr21.fasta -q erg.fasta]
Hostname: [oregano]
C4 Alignment:
------------
Query: gi|609878487|ref|NM_001291391.1| Homo sapiens ERG, ETS transcription factor (ERG), transcript variant 8, mRNA
Target: gi|528476536|ref|NC_018932.2| Homo sapiens chromosome 21, alternate assembly CHM1_1.1, whole genome shotgun sequence:[revcomp]
Model: est2genome
Raw score: 7669
Query range: 0 -> 1546
Target range: 39594417 -> 39332536
1 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 54
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594417 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 39594364
55 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 108
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594363 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 39594310
109 : AGGAGCGGCGCTCAG >>>> Target Intron 1 >>>> GTTATTCCAG : 133
|||||||||||||||++ 76685 bp ++||||||||||
39594309 : AGGAGCGGCGCTCAGgt.........................agGTTATTCCAG : 39517600
134 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 187
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39517599 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 39517546
188 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAG >>>> Target In : 226
||||||||||||||||||||||||||||||||||||||++ 9093
39517545 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAGgt.............. : 39517505
227 : tron 2 >>>> CCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 266
bp ++|||||||||||||||||||||||||||||||||||||||||
39517504 : ...........agCCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 39508374
267 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAG >>>> Ta : 312
|||||||||||||||||||||||||||||||||||||||||||||++
39508373 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAGgt....... : 39508326
313 : rget Intron 3 >>>> GAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 345
130340 bp ++||||||||||||||||||||||||||||||||||
39508325 : ..................agGAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 39377955
346 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 399
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377954 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 39377901
400 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 453
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377900 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 39377847
454 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 507
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377846 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 39377793
508 : CTAGCCAGGTGAATGGCTCAAG >>>> Target Intron 4 >>>> GAA : 532
||||||||||||||||||||||++ 21741 bp ++|||
39377792 : CTAGCCAGGTGAATGGCTCAAGgt.........................agGAA : 39356027
533 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 586
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39356026 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 39355973
587 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 640
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39355972 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 39355919
641 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAG >>>> Target : 682
|||||||||||||||||||||||||||||||||||||||||++ 19
39355918 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAGgt........... : 39355875
683 : Intron 5 >>>> ATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 719
698 bp ++||||||||||||||||||||||||||||||||||||||
39355874 : ..............agATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 39336142
720 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 773
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336141 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 39336088
774 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 827
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336087 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 39336034
828 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 881
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336033 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 39335980
882 : GAGA >>>> Target Intron 6 >>>> CTCCTCTTCCACATTTGACTT : 906
||||++ 867 bp ++|||||||||||||||||||||
39335979 : GAGAgt.........................agCTCCTCTTCCACATTTGACTT : 39335088
907 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 960
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39335087 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 39335034
961 : ACACAG >>>> Target Intron 7 >>>> GGGGTGCAGCTTTTATTTT : 985
||||||++ 1911 bp ++|||||||||||||||||||
39335033 : ACACAGgt.........................agGGGGTGCAGCTTTTATTTT : 39333098
986 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 1039
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333097 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 39333044
1040 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 1093
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333043 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 39332990
1094 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 1147
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332989 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 39332936
1148 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 1201
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332935 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 39332882
1202 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 1255
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332881 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 39332828
1256 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 1309
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332827 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 39332774
1310 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 1363
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332773 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 39332720
1364 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 1417
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332719 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 39332666
1418 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 1471
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332665 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 39332612
1472 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 1525
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332611 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 39332558
1526 : CCATTCATGCAAAAAAAAAAA : 1546
||||||||||||||| ||| |
39332557 : CCATTCATGCAAAAATAAACA : 39332537
vulgar: gi|609878487|ref|NM_001291391.1| 0 1546 + gi|528476536|ref|NC_018932.2| 39594417 39332536 - 7669 M 123 123 5 0 2 I 0 76681 3 0 2 M 102 102 5 0 2 I 0 9089 3 0 2 M 86 86 5 0 2 I 0 130336 3 0 2 M 218 218 5 0 2 I 0 21737 3 0 2 M 152 152 5 0 2 I 0 19694 3 0 2 M 204 204 5 0 2 I 0 863 3 0 2 M 81 81 5 0 2 I 0 1907 3 0 2 M 580 580
-- completed exonerate analysis
Alternativamente, puede usar un recurso en línea como la página BLAT de UCSC para alinear el ARNm con el genoma. Puedes ver los resultados aquí y en la siguiente imagen:
Como puede ver, nuestra secuencia de ARNm de consulta (NM_001291391.1) se superpone perfectamente con el gen ERC.
No existe una correspondencia uno a uno entre el ARN y los genes, pero no tanto por la razón que parece tener en mente (aunque no estoy seguro de lo que tiene en mente).
Debe leer el artículo de wikipedia sobre empalme de ARN , le enseñará mucho de lo que necesitará para llegar a la respuesta que podría estar buscando.
También es posible que desee seguir un curso introductorio como la serie ADN a ARN a proteína de Khan Academy .
Vance L Albaugh
Tyto alba
StarckOverflar
terdón