Secuencias de ADN BLAST invertidas

He estado tratando de aprender algunas técnicas básicas de secuenciación de ADN y he estado usando BLAST como referencia. Pensé que estaba empezando a entenderlo, pero luego me encontré con esto:

ingrese la descripción de la imagen aquí

Parece que dice que el partido comienza en 10835 y termina en un índice más pequeño (10714). Intenté hacer clic en el enlace para ver la secuencia completa y no pude encontrar la parte resaltada en ninguna parte (ni en 10835 ni en 10776).

Mi pregunta es: ¿Dónde (en NR_046235.1 ) puedo encontrar la secuencia resaltada? ¿Y qué significa decir que Sbjctcomienza en 10835 y termina en un índice más bajo?

Puedo publicar mi consulta si es necesario. Gracias.

Solo para ayudarlo con las respuestas a continuación: hay muchas herramientas en línea que le permiten generar el complemento inverso de una secuencia si tiene dificultades para 'ver' esto, por ejemplo, bioinformatics.org/sms/rev_comp.html
@Alan No es necesario, un simple comando de consola hace lo mismo por ti:(tr ACGT TGCA | rev) <<< 'GATTACA'
Me gusta más el one-liner de @KonradRudolph como una solución directa, pero también tenga en cuenta que muchos lenguajes de programación tienen bibliotecas para las tareas diarias de procesamiento de secuencias.

Respuestas (2)

Tenga en cuenta que la secuencia de consulta que ha proporcionado coincide con el hilo negativo de su secuencia de destino. Eso significa que no solo se invertirá la secuencia objetivo (como ha notado), sino que también se complementará. Entonces, en el registro de GenBank, no debe buscar la secuencia que CCGACCGA...comienza en la posición 10835, debe buscar la secuencia que ...TCGGTCGGtermina en 10835.

ccgaccga...    minus strand
||||||||
bbɔʇbbɔʇ...    forward strand

La secuencia en el registro de GenBank contiene espacios, por lo que complica encontrar su secuencia usando la función "Buscar" del navegador, pero si usa los índices de posición al principio y al final de cada línea de secuencia, podrá encontrar el complemento inverso. de la secuencia coincidente informada en los resultados de BLAST.

¡Gracias por esta explicacion! Acepté la respuesta de @terdon porque era un poco más amigable para principiantes.

Solo para desarrollar un poco la respuesta de Daniel Standage, recuerde que un genoma tiene doble cadena y una cadena es complementaria a la otra. Los genes se pueden encontrar en cualquier hebra, los dos son biológicamente equivalentes. Sin embargo, los proyectos de secuenciación eligen uno de los dos hilos (al azar) y lo llaman el hilo más (+) y luego guardan todas las secuencias con respecto a ese hilo. Esto significa que, a veces, la secuencia genómica que descarga de una base de datos puede ser el complemento de la secuencia real que está buscando.

BLAST y algoritmos similares toman esto en cuenta y compararán su secuencia de consulta con ambos hilos. Si su consulta llega a la secuencia de destino en el hilo -, BLAST le dará un resultado como el que ha obtenido, donde el inicio del HSP es más bajo que el final. Esto se debe a que la traducción del ARN (aunque no la transcripción del ADN) va en una dirección de 5' a 3', en ambas cadenas. Por lo tanto, "leemos" los genes en esa dirección. Las coordenadas son siempre con respecto a la hebra + ya que siempre consideramos el ADN en una dirección de 5' a 3', esto significa que su posición inicial parecerá estar después de su posición final. Esto se explica mejor usando una imagen:

ingrese la descripción de la imagen aquí

En la imagen de arriba, la línea azul representa su hit BLAST. Se extiende desde la posición 10 hasta la posición 40 (con respecto a la hebra +). Sin embargo, dado que está en el hilo negativo, BLAST lo mostrará comenzando en la posición 40 y terminando en la posición 10.