¿Todos los alineamientos de secuencias múltiples emplean algoritmos de alineamiento global?

Los alineamientos de secuencias múltiples generalmente se realizan entre secuencias de longitud similar, lo que se asemeja más a un alineamiento global. Sin embargo, no estoy seguro de cuál sería el fondo algorítmico en tal caso. ¿Es esencialmente una alineación global o local cuando uno realiza una alineación de secuencia múltiple?

Las alineaciones globales o locales significan alinear partes de la secuencia o la secuencia completa, mientras que las alineaciones múltiples son cuántas secuencias alinear (una o más de una). No son términos mutuamente excluyentes. Consulte "¿ Cuál es la diferencia entre las alineaciones de secuencias locales y globales? "

Respuestas (3)

Es peligroso generalizar, ya que diferentes programas de alineación de secuencias múltiples (MSA) bien pueden emplear diferentes algoritmos. Sin embargo, como el objetivo es alinear muchas secuencias a lo largo de toda su longitud, y todos los programas de MSA de los que tengo conocimiento presentan los resultados como tales, es difícil prever que se emplee otra cosa que no sea la alineación global .

Para los Clustal W y X ampliamente utilizados, este es sin duda el caso. Clustal emplea un algoritmo de alineación progresiva que implica la suposición heurística de que las secuencias más alineadas por alineación por pares son una base válida para el orden en el que se realiza la alineación múltiple progresiva. Las alineaciones iniciales por pares (que se utilizan para producir un árbol guía) utilizan una alineación global dinámica, al igual que cada paso de alineación progresiva, aunque esta alineación es para un perfil de secuencias previamente alineadas y utiliza una puntuación dependiente del contexto.

Hay un extenso artículo de Wikipedia sobre MSA y uno de los documentos originales de Clustal está disponible gratuitamente en línea. El excelente libro de Durbin et al. , Biological Sequence Analysis , contiene un capítulo sobre el tema.

La alineación de secuencias múltiples es una tarea muy compleja y existen varios enfoques según lo que esté buscando.

Una alineación global podría encontrar la región más cercana en general. Sin embargo, es un problema bien conocido con las longitudes. Si las longitudes de las secuencias son muy diferentes, esto puede generar malas alineaciones.

La alineación local busca las mejores regiones coincidentes a lo largo de las secuencias.

Es bien sabido que algunas regiones genómicas tienden a acumular más mutaciones que otras. Para esto se sugiere la idea de dominios. La idea principal detrás (y para hacerlo más simple) es como realizar varias alineaciones locales para obtener las alineaciones óptimas para diferentes regiones de sus secuencias.

Hay muchos algoritmos que implementaron métodos muy diferentes para hacerlo: desde alineaciones por pares hasta perfiles HMM.

Recomendaría leer este artículo .

Tal como dijo James, estos términos no son mutuamente excluyentes.
tu afirmación no es correcta:

Los alineamientos de secuencias múltiples generalmente se realizan entre secuencias de longitud similar

Realmente depende de lo que quieras lograr con tu MSA (alineación de secuencias múltiples). Primero, una breve explicación sobre la alineación local y global (la diferencia entre estos dos se describe anteriormente en esta pregunta ):

alineación local: tratando de hacer coincidir una parte de su secuencia de interés con otra secuencia , esto podría hacerse con MSA, piense en BLAST . Usando BLAST, está realizando una alineación de secuencia local con todas las secuencias en la base de datos. Al usar esta alineación local, se está enfocando en las partes que se superponen entre su secuencia y las de la base de datos -> pista sobre dominios, por ejemplo,

alineación global: la coincidencia de toda la secuencia con otra secuencia, que NO tiene que ser igual en tamaño .Cuando se usa una alineación global con secuencias de diferente longitud, por ejemplo, lo que sucederá es que dependiendo del algoritmo que se esté usando ( Needleman-Wunsch ), se insertarán espacios para hacer coincidir esas secuencias en toda la longitud.

Algunos ejemplos prácticos de cuándo usar qué alineación:

  • Elaboración de perfiles de un grupo de proteínas --> alineación global
  • Interesado en proteínas homólogas -> la mayoría de las veces usa una alineación de secuencia local, especialmente cuando sabe que los homólogos están bastante lejos, por lo que no hay mucha similitud de secuencia.
  • al buscar proteínas que podrían tener una función similar --> alineación local, BLAST le dará las proteínas que tienen los mismos dominios, por ejemplo, o la misma estructura al realizar una explosión contra la base de datos PDB, lo que puede brindarle pistas importantes sobre la función de la proteína de interés.

TENGA EN CUENTA que estas sugerencias son solo algunos ejemplos, algunas personas preferirán otra opción .

Rick, es posible que el inglés no sea tu primer idioma, pero eso no es excusa para que no uses un corrector ortográfico. Si puede configurar el idioma de su navegador en inglés (Firefox me permite cambiar a francés, etc.), la mayoría revisará la ortografía del texto ingresado. De lo contrario, copie el texto en un procesador de textos como Word, selecciónelo todo, establezca el idioma en inglés (británico, por supuesto ;-)) y ejecute una revisión ortográfica.
Gracias voy a intentar eso! , de hecho, revisará la ortografía de mis palabras escritas en el idioma de mi navegador (holandés). Entonces, si escribo una palabra en inglés, la cambiará o la dividirá para que parezca holandesa, por lo que cambiar la configuración de mi navegador solucionará ese problema (espero) @David