¿Qué algoritmo o algoritmos se consideran estándar o avanzados para la alineación de secuencias múltiples ?
¿Qué tan grande es la necesidad de mejores algoritmos? ¿Cuántas secuencias deben alinearse en una prueba típica? Estoy tratando de entender cuán importante es este problema en bioinformática.
Mi voto va para Mafft(insi) ya que tiene una precisión de ~86 % y resultados en ~1,2 horas. Aunque el más rápido será kalign, solo tarda unos 3 minutos en terminar con una precisión del 74,3 %.
Para las pruebas:
Para cada una de las 218 alineaciones de referencia en el punto de referencia, aplicamos ocho programas de alineación, lo que resultó en un total de 1744 MSA construidos automáticamente. La calidad general de estas alineaciones automáticas se midió utilizando el puntaje de columna (CS) descrito en Métodos.
FIGURA 1: Desempeño general de alineación para cada uno de los programas MSA probados.
(A) Precisión general
(B) Tiempo de ejecución total para construir todas las alineaciones (se utiliza una escala log10 para fines de visualización).
doi:10.1371/journal.pone.0018093.g003
Fuente y créditos fotográficos:
PD: Esto es de un documento antiguo de 2011. Si desea las nuevas estadísticas, siempre puede probar por su cuenta, mediante el proceso descrito en el documento de origen.
Los algoritmos PRANK y PAGAN salieron del laboratorio de Loytynoja en Finlandia y están agitando un poco la olla. Utilizan relaciones filogenéticas inferidas como parámetro y tienden a producir una alineación mucho más 'brecha', supuestamente debido a un manejo más preciso de los indeles. Para alineaciones fáciles, el método no importa tanto, pero si las secuencias son muy divergentes, podría valer la pena revisar PAGAN y PRANK .
Clustal se ha reinventado a sí mismo como Clustal Omega usando Modelos Ocultos de Markov, y es particularmente adecuado para la alineación de muchas secuencias.
skymningen
Científico loco
skymningen
WYSIWYG
WYSIWYG
5heikki