¿Cuál es la diferencia entre las alineaciones de secuencias locales y globales?

Hay un montón de diferentes herramientas de alineación por ahí , y no quiero atascarme en las matemáticas detrás de ellas, ya que esto no solo entre software, sino que varía de una versión de software a otra.

Hay dos divisiones principales en los programas; algunos usan alineaciones locales y otros usan alineaciones globales. Mi pregunta es triple:

  • ¿Cuáles son las diferencias fundamentales entre los dos?
  • ¿Cuales son las ventajas y desventajas de cada uno?
  • ¿Cuándo se debe usar una alineación de secuencia global o local?

Respuestas (3)

La diferencia muy básica entre una alineación local y una global es que en una alineación local, intenta hacer coincidir su consulta con una subcadena (una parte) de su tema (referencia). Mientras que en una alineación global, realiza una alineación de extremo a extremo con el tema (y, por lo tanto, como dijo von Mises, puede terminar con muchas brechas en la alineación global si los tamaños de consulta y tema son diferentes). Es posible que también tenga lagunas en la alineación local.

Alineación local

5' ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA 3' 
             |||| |||||| |||||||||||||||
          5' TACTCACGGATGAGGTACTTTAGAGGC 3'

Alineación Global

5' ACTACTAGATTACTTACGGATCAGGTACTTTAGAGGCTTGCAACCA 3'
   |||||||||||    |||||||  |||||||||||||| |||||||
5' ACTACTAGATT----ACGGATC--GTACTTTAGAGGCTAGCAACCA 3'

Daré el ejemplo de los bien conocidos algoritmos de programación dinámica. En el algoritmo Needleman-Wunsch (Global), el seguimiento de la puntuación se realiza desde la coordenada (m,n) correspondiente a la esquina inferior derecha de la matriz de puntuación (es decir, el final de las secuencias alineadas), mientras que en el Smith-Waterman (local), se hace a partir del elemento con mayor puntuación en la matriz (es decir, el extremo del par de mayor puntuación). Puede consultar estos algoritmos para obtener más detalles.

Puede adoptar cualquier esquema de puntuación y no hay una regla fija para ello.

Las alineaciones globales generalmente se realizan para comparar genes homólogos, mientras que la alineación local se puede usar para encontrar dominios homólogos en genes que de otro modo no serían homólogos.

La alineación global es cuando se tiene en cuenta la totalidad de ambas secuencias al buscar alineaciones, mientras que en local solo se puede tener en cuenta una pequeña parte. Esto suena confuso así que aquí un ejemplo:

Digamos que tiene una referencia grande, tal vez 2000 pb. Y tienes una secuencia, que es de aproximadamente 100 pb. Digamos que la referencia contiene la secuencia casi exactamente. Si hicieras una alineación de local, tendrías un muy buen partido. Pero si hizo una alineación global, es posible que no coincida. En su lugar, puede buscar coincidencias en toda la referencia, por lo que terminaría con una alineación con muchos espacios grandes. No importa que coincida casi perfectamente en una región particular de la referencia, porque está buscando coincidencias globalmente (es decir, en toda la referencia).

Si tiene una coincidencia realmente buena, puede que no importe qué tipo de alineación use. Pero cuando tienes desajustes y demás, comienza a ser importante. Esto se debe a los algoritmos de puntuación utilizados. En el ejemplo anterior, digamos que hay una región de 100 pb en la referencia que coincide con su secuencia de 100 pb con un 85 % de precisión. En la alineación local, es muy probable que se alinee allí. Ahora digamos que los primeros 30 pb de su secuencia coinciden con una región al comienzo de la referencia 95 %, y los siguientes 30 pb coinciden con una región en el medio de la referencia 85 %, y los 40 pb finales coinciden con una región al final de la referencia alrededor del 90%. En la alineación global, la mejor coincidencia es la alineación con espacios, mientras que en la alineación local, la alineación sin espacios sería la mejor. Creo que, en general, las penalizaciones por brecha son menores en las alineaciones globales, pero

Lo que quieras usar depende de lo que estés haciendo. Si cree que su secuencia es una subsecuencia de la referencia, realice una alineación local. Pero si cree que toda su secuencia debe coincidir con toda su referencia, haría una alineación global.

Eche un vistazo al archivo de imagen adjunto. Despejará sus dudas sobre la ingrese la descripción de la imagen aquídiferencia entre las alineaciones de secuencias locales y globales.

No publique respuestas de texto como archivos de imagen en SE Biology. Esto discrimina a las personas con problemas de visión que utilizan lectores de pantalla y no permite una indexación adecuada.