Herramientas BLASTn frente a ORF

Los proyectos de secuenciación secuencian una hebra y la llaman hebra + y luego extrapolan la secuencia de la hebra -. Esto significa que, a veces, la secuencia genómica que descarga de una base de datos puede ser el complemento de la secuencia real que está buscando. blastn tener esto en cuenta y hacer la alineación por pares para el complemento de la secuencia real también?

Respuestas (1)

Depende del sabor de BLAST que esté usando. Algunos lo hacen, otros no. Específicamente, los sabores clásicos de BLAST son:

  • blastp : compara una secuencia de consulta de aminoácidos con una base de datos de secuencias de proteínas
  • blastn : compara una secuencia de consulta de nucleótidos con una base de datos de secuencias de nucleótidos
  • blastx : compara los productos de traducción conceptual de seis marcos de una secuencia de consulta de nucleótidos (ambas hebras) con una base de datos de secuencias de proteínas
  • tblastn : compara una secuencia de consulta de proteína con una base de datos de secuencias de nucleótidos traducida dinámicamente en los seis marcos de lectura (ambas cadenas).
  • tblastx : compara las traducciones de seis fotogramas de una secuencia de consulta de nucleótidos con las traducciones de seis fotogramas de una base de datos de secuencias de nucleótidos. (Debido a la naturaleza de tblastx, las alineaciones con espacios no están disponibles con esta opción)

De estos, tblastny tblastxtodos blastxmarcan los 6 marcos de lectura posibles (ambos hilos). Esto solo tiene sentido para las búsquedas de proteínas, ya que ese es el único caso en el que el marco de lectura es relevante. El simple blastn no se ocupa de los marcos de lectura, pero sí de los golpes contra la hebra inversa. La hebra coincidente se resalta en la salida y los números en el HSP lo reflejan.

Por ejemplo, estas son la primera y la última línea de uno de los aciertos al chorrear el complemento inverso del gen tP53 humano contra las secuencias humanas de la nrbase de datos:

Range 1: 1 to 2591GenBankGraphics Next Match Previous Match
Alignment statistics for match #1 Score Expect  Identities  Gaps    Strand
4673 bits(5182)     0.0     2591/2591(100%)     0/2591(0%)  Plus/Minus

Query  1     CACCCCTCAGACACACAGGTGGCAGCAAAGTTTTATTGTAAAATAAGAGATCGATATAAA  60
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2591  CACCCCTCAGACACACAGGTGGCAGCAAAGTTTTATTGTAAAATAAGAGATCGATATAAA  2532


[...]

Query  2521  AGACTTTTGAGAAGCTCAAAACTTTTAGCGCCAGTCTTGAGCACATGGGAGGGGAAAACC  2580
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  71    AGACTTTTGAGAAGCTCAAAACTTTTAGCGCCAGTCTTGAGCACATGGGAGGGGAAAACC  12

Query  2581  CCAATCCCATC  2591
             |||||||||||
Sbjct  11    CCAATCCCATC  1

Tenga en cuenta que 1) los hilos se dan como "más/menos", lo que significa que la secuencia de consulta está alineada con el hilo - del objetivo y 2) que las coordenadas de la secuencia del sujeto comienzan desde el final (2591) y van al principio (1).

Entonces, sí, incluso las herramientas simples como BLAST sin traducir tienen en cuenta los dos hilos.

A veces, los aciertos también pueden ser "falsos positivos" si la secuencia está alineada contra la cadena -. En ese caso, ¿cuál es la solución?
@Raghavakrishna, ¿por qué serían falsos positivos porque se alinean contra el hilo?
Si la secuencia de cadena negativa no es la secuencia real que codifica, a veces podría ser equivalente a alguna otra secuencia (¿falso positivo?)
@Raghavakrishna Lo siento, pero todavía no entiendo. Los detalles siempre dependen de lo que realmente estás haciendo. Si BLAST le da un golpe, entonces eso es un golpe. Si eso es biológicamente relevante o no es otra pregunta y no puedo responder a eso a menos que sepa qué pregunta está haciendo.