¿Herramienta bioinformática para la "alineación por pares" de secuencias complementarias?

Actualmente estoy trabajando en la unión de ribozimas y estoy buscando una herramienta que esencialmente analice las regiones del grado de complementariedad en dos secuencias para extrapolar la eficiencia de la unión. Después de pensarlo, esencialmente busco "lo opuesto" de BLAST, en el sentido de que BLAST busca regiones de similitud en secuencias en la misma orientación, mientras que busco regiones de complementariedad en secuencia en la orientación opuesta .

¿Existe tal herramienta?

EDITAR 1

Para aclarar, estoy buscando una herramienta que pueda detectar las regiones más óptimas de complementariedad en dos secuencias cuando ambas están alineadas como tales:

5' TCGAAAUAACTCGTCUGAUGAGUCGCUGAAAUGCGACGAAACCGTTAACGGA 3'

3' GTTTTACGCAAAGCAGCGTAAAGTCGCTGAGTAGTCACTTTAATGAC 5'

¿Lo contrario? ¿Te refieres a regiones de baja similitud o realmente complementarias? Si es lo último, solo use sabores explosivos traducidos. Si publica una secuencia de ejemplo para aclarar, debería poder darle una respuesta precisa.
Perdón por la confusión: busco regiones de alta complementariedad. Editaré la pregunta en un momento.

Respuestas (3)

No estoy seguro de que esto sea lo que necesita, ya que las secuencias que publicó no son en realidad complementarias, por lo que puedo decir. Sin embargo, exoneratees una de las herramientas más poderosas que existen y también puede hacer esto. Usando estas secuencias como ejemplos:

>consulta TAGCTTATTGATGGGAGGAGAGTCCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGCCCAGG
>objetivo CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGTCTGTTATGTGCACGTACTCTCCTCCCCTCAATAAGCTA

Y este comando (debe ejecutarse en un sistema *nix):

exonerate -m coding2coding -q qq.fa -t test.fa -s 0

Obtengo esta salida:

C4 Alignment:
------------
         Query: query [revcomp]
        Target: target
         Model: genome2genome
     Raw score: 312
   Query range: 71 -> 0
  Target range: 0 -> 70

 71 :                                                          CCA       :  6
      CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGGTCTGTCATGTGCACGGACTCTCCTCProTCAATA
      |||||||||||||||||||||||||||||| |||||| ||||||||| |||||||||||+||||||
      CCTGGGCTTCCTGCAGTCTGGGACAGCCAA-GTCTGTTATGTGCACGTACTCTCCTCProTCAATA
  1 :                                                          CCC       : 65

  5 : AGCTA :  1
      |||||
 66 : AGCTA : 70

vulgar: query 71 0 - target 0 70 + 312 M 30 30 G 1 0 M 26 26 C 3 3 M 11 11

C4 Alignment:
------------
         Query: query
        Target: target [revcomp]
         Model: genome2genome
     Raw score: 309
   Query range: 0 -> 71
  Target range: 70 -> 0

  1 :                      GTC                                           : 66
      TAGCTTATTGATGGGAGGAGAValCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGC
      ||||||||||| |||||||||||+||||||||| ||||| ||||||||||||||||||||||||||
      TAGCTTATTGAGGGGAGGAGAValCGTGCACATAACAGA-CTTGGCTGTCCCAGACTGCAGGAAGC
 70 :                      GTA                                           :  6

 67 : CCAGG : 71
      |||||
  5 : CCAGG :  1

vulgar: query 0 71 + target 70 0 - 309 M 21 21 C 3 3 M 15 15 G 1 0 M 31 31

Básicamente te da dos alineaciones, una leyendo el objetivo 3->5 y la consulta 5->3 y otra al revés.

Alternativamente, podría hacer una búsqueda explosiva traducida, tBLASTx, que traducirá tanto la secuencia de destino como la de consulta y, por lo tanto, debería encontrar regiones complementarias.

¿Ahí es donde agarraste el tuyo? Acabo de instalarlo y obtuve resultados diferentes. Parte de esto es visual (nombres AA, indexación basada en 1 versus 0), pero los puntajes son bastante diferentes.
@Amory Estoy usando el de los repositorios de Debian, v. 2.2.0. Sí, la página a la que se vinculó es la página de inicio, así que supongo que acaba de obtener una versión más nueva y han cambiado un poco el algoritmo. Quizás una matriz de puntuación diferente. En cualquier caso, la puntuación aquí es irrelevante ya que dependerá directamente de la duración de la secuencia.
@terdon Pensándolo bien, ¿hacer una alineación regular por pares con el complemento inverso de solo una de las secuencias daría el mismo resultado?
@LanceLafontaine probablemente, pero será más lento y quizás menos preciso. Si está buscando secuencias posiblemente complementarias que puedan unirse entre sí, usaría algo como exonerar o explotar en lugar de un alineador de secuencias.
@terdon: No entiendo por qué sugirió tblast. La traducción no tiene relación con la complementariedad.
@WYSIWYG Recomendé tBLASTx. tBLASTx traducirá las secuencias de entrada en los 6 fotogramas, lo que incluye la cadena -, que es el complemento inverso de la cadena +. Por lo tanto, se puede usar para encontrar secuencias complementarias ya que la traducción 5'->3' de la cadena positiva será la traducción 3'->5' de la cadena -.
sí, pero el mismo producto de traducción puede surgir con diferentes codones y, por lo tanto, no podrá evaluar la complementariedad.
@WYSIWYG, de hecho, estoy muy acostumbrado a las búsquedas explosivas traducidas y fue lo primero que pensé porque también mostrarán una complementariedad más débil. Dado que la mayoría de los codones homónimos cambian solo en la posición de oscilación, es posible que pueda detectar la complementariedad con mayor facilidad precisamente debido a la redundancia del código. En cualquier caso, exoneratefue mi primera sugerencia, y estoy de acuerdo en que su explosión de nucleótidos simple es probablemente mejor que las traducciones.

Puede intentar usar una herramienta para estimar las afinidades de unión de las dos secuencias, es decir, OligoCalc

http://www.basic.northwestern.edu/biotools/OligoCalc.html

Simplemente ejecute explosión con solo las Plus-Minusalineaciones. Ver esta publicación en biostar; es similar a lo que le interesa. Esto es para la versión independiente. No estoy seguro de cómo hacerlo en la explosión en línea. Si solo tiene dos secuencias, puede usar UNAfold para verificar la complementariedad.