Puntuación de alineación de secuencia

La siguiente tabla es del texto Computational Gene Analysis de Deonier en la p. 152. Este es un ejercicio de alineación de secuencias globales y puntuación de secuencias alternativas. El texto proponía una solución (entre paréntesis). Dejando a un lado la parte superior izquierda de la tabla, parece que puede haber un camino mejor.

Es más probable que no entienda bien la idea que que haya un error tipográfico.

T GRAMO GRAMO T GRAMO ( 0 ) 2 4 6 8 10 A ( 2 ) 1 3 5 7 9 T 4 ( 1 ) 2 4 4 6 C 6 3 ( 2 ) 3 5 5 GRAMO 8 5 2 ( 1 ) 3 4 T 10 7 4 3 ( 0 ) ( 2 )

Solo mirando la esquina superior izquierda,

( 0 ) 2 4... 2 ( 1 ) 3... 4 ( 1 ) 2... 6 3 ( 2 ) . . .

lo que parece dar -7 frente a -8 para la ruta del libro. A continuación se muestra la alineación del libro y la correspondiente a mi puntuación, lo que puede revelar mi error.

A : A T C GRAMO T B : T GRAMO GRAMO T GRAMO

A : A T C GRAMO T B : T GRAMO GRAMO T GRAMO

No tuve problemas para construir la matriz simplemente puntuándola. es un punto pequeño, pero no me gusta seguir adelante sin entenderlo. Gracias por cualquier ayuda.

Editar: ambas respuestas actuales parecen claras en esto, pero solo para completar: una coincidencia = 1; desajuste = -1; indel = -2.

Respuestas (2)

Si no me equivoco, la tabla muestra los caminos de menor resistencia. Hay muchos caminos a través de esta tabla y todos ellos no se muestran solo los que cuestan menos. Debe comprender que una falta de coincidencia entre las letras cuesta -1 (por ejemplo, - AT), pero un cuadrado vacío cuesta -2 (-A o -T). Entonces, su solución costaría = -1-3-4-3-2-4, lo que también suma -17.

Esta es una tabla de alineación completa. El valor superior va en diagonal, el segundo valor va hacia abajo y el tercer valor va hacia la derecha.

Una tabla de alineación completa

¿Podrías explicar cómo obtienes ese -17? Una brecha cuesta entre -2 y -10 dependiendo de cuál en la tabla en el OP. La puntuación del desajuste también cambia. ¿De dónde vienen tus números?
La puntuación de una falta de coincidencia siempre es -2, solo si usa más de un espacio, entonces aumenta en -2 con cada espacio. Es por eso que la fila superior es -2 (un espacio); -4 (dos huecos); -6 (tres huecos) y así sucesivamente. Expliqué cómo obtuve -17 = - 1 - 3 - 4 - 3 - 2 - 4. Solo necesitas sumar los valores de cada lugar.

El problema es que estás usando el Tdoble. Construyamos la alineación manualmente, tenemos dos secuencias:

>seq1
ATCGT
>seq2
TGGTG

Entonces, para construir la alineación usando su enfoque, tomaríamos el primer nt de seq1, Ay elegiríamos el nt de puntuación más alta de seq2 para alinearlo. En su ejemplo, ese sería el T(-1) que produce:

A
T

Bien, ahora pasamos al siguiente nt de seq1, el T. Ahora, en su tabla, el puntaje más alto es para TT pero ya hemos usado Tfrom seq2 , ¡no podemos usarlo nuevamente! En su alineación, usó un -. La puntuación para T-la posición 2 es -4. Esto significa que su alineación:

ATCGT-
T-GGTG

Tiene una puntuación de:

( A T ) pag o s 1 + ( T ) pag o s 2 + ( C GRAMO ) pag o s 3 + ( GRAMO GRAMO ) pag o s 4 + ( T T ) pag o s 5 + ( GRAMO ) pag o s 6

Cual es:

1 4 2 1 10 = 18

Mientras que la alineación del libro es:

( A ) pag o s 1 + ( T T ) pag o s 2 + ( C GRAMO ) pag o s 3 + ( GRAMO GRAMO ) pag o s 4 + ( T T ) pag o s 5 + ( GRAMO ) pag o s 6

Cual es:

2 1 2 1 10 = dieciséis

@daniel, en cuyo caso probablemente esté equivocado (mi enfoque, no su texto). Tomando lo que muestra fuera de contexto, simplemente estoy usando el puntaje para cada posición. Entonces, dado que T-tiene una puntuación de -10en su tabla, estoy usando eso.
Estamos de acuerdo en las alineaciones. ¿Por qué el segundo puntaje es -4 en mi alineación? Eso podría aclararme.
Si está diciendo que el -4 en mi puntuación es porque es -2 en la 2.ª posición, entonces ¿por qué -1 en la 4.ª posición no es -4? Esto podría aclarar.
@daniel, el -4 en su puntuación se debe a que una T en la secuencia 1 alineada con una -en la secuencia 2 tiene una puntuación de -4 en la tabla. El -1 se debe a que TT tiene una puntuación de -1 en la tabla. Sin embargo, aunque en realidad he trabajado con este tipo de cosas, nunca lo he trabajado en profundidad y fue hace unos años, es posible que me equivoque.