Actualmente estoy trabajando en la unión de ribozimas y estoy buscando una herramienta que esencialmente analice las regiones del grado de complementariedad en dos secuencias para extrapolar la eficiencia de la unión. Después de pensarlo, esencialmente busco "lo opuesto" de BLAST, en el sentido de que BLAST busca regiones de similitud en secuencias en la misma orientación, mientras que busco regiones de complementariedad en secuencia en la orientación opuesta .
¿Existe tal herramienta?
EDITAR 1
Para aclarar, estoy buscando una herramienta que pueda detectar las regiones más óptimas de complementariedad en dos secuencias cuando ambas están alineadas como tales:
5' TCGAAAUAACTCGTCUGAUGAGUCGCUGAAAUGCGACGAAACCGTTAACGGA 3'
3' GTTTTACGCAAAGCAGCGTAAAGTCGCTGAGTAGTCACTTTAATGAC 5'
No estoy seguro de que esto sea lo que necesita, ya que las secuencias que publicó no son en realidad complementarias, por lo que puedo decir. Sin embargo, exonerate
es una de las herramientas más poderosas que existen y también puede hacer esto. Usando estas secuencias como ejemplos:
>consulta TAGCTTATTGATGGGAGGAGAGTCCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGCCCAGG
>objetivo CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGTCTGTTATGTGCACGTACTCTCCTCCCCTCAATAAGCTA
Y este comando (debe ejecutarse en un sistema *nix):
exonerate -m coding2coding -q qq.fa -t test.fa -s 0
Obtengo esta salida:
C4 Alignment:
------------
Query: query [revcomp]
Target: target
Model: genome2genome
Raw score: 312
Query range: 71 -> 0
Target range: 0 -> 70
71 : CCA : 6
CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGGTCTGTCATGTGCACGGACTCTCCTCProTCAATA
|||||||||||||||||||||||||||||| |||||| ||||||||| |||||||||||+||||||
CCTGGGCTTCCTGCAGTCTGGGACAGCCAA-GTCTGTTATGTGCACGTACTCTCCTCProTCAATA
1 : CCC : 65
5 : AGCTA : 1
|||||
66 : AGCTA : 70
vulgar: query 71 0 - target 0 70 + 312 M 30 30 G 1 0 M 26 26 C 3 3 M 11 11
C4 Alignment:
------------
Query: query
Target: target [revcomp]
Model: genome2genome
Raw score: 309
Query range: 0 -> 71
Target range: 70 -> 0
1 : GTC : 66
TAGCTTATTGATGGGAGGAGAValCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGC
||||||||||| |||||||||||+||||||||| ||||| ||||||||||||||||||||||||||
TAGCTTATTGAGGGGAGGAGAValCGTGCACATAACAGA-CTTGGCTGTCCCAGACTGCAGGAAGC
70 : GTA : 6
67 : CCAGG : 71
|||||
5 : CCAGG : 1
vulgar: query 0 71 + target 70 0 - 309 M 21 21 C 3 3 M 15 15 G 1 0 M 31 31
Básicamente te da dos alineaciones, una leyendo el objetivo 3->5 y la consulta 5->3 y otra al revés.
Alternativamente, podría hacer una búsqueda explosiva traducida, tBLASTx, que traducirá tanto la secuencia de destino como la de consulta y, por lo tanto, debería encontrar regiones complementarias.
exonerate
fue mi primera sugerencia, y estoy de acuerdo en que su explosión de nucleótidos simple es probablemente mejor que las traducciones.Puede intentar usar una herramienta para estimar las afinidades de unión de las dos secuencias, es decir, OligoCalc
Simplemente ejecute explosión con solo las Plus-Minus
alineaciones. Ver esta publicación en biostar; es similar a lo que le interesa. Esto es para la versión independiente. No estoy seguro de cómo hacerlo en la explosión en línea. Si solo tiene dos secuencias, puede usar UNAfold para verificar la complementariedad.
terdón
LanceLafontaine