Después de la Alineación de secuencias múltiples (MSA), se producen conjuntos de datos en los que se utilizan modelos de evolución. He visto en libros que si hay una gran similitud entre las secuencias, se usa la máxima parsimonia (MP), si es baja, entonces se usa la evolución mínima, y si hay una similitud muy débil, se usa el método basado en la distancia. Sin embargo, todos estos tienen sus propias desventajas. Dado que los métodos basados en caracteres son más confiables (como en el libro), ¿se pueden usar estos métodos incluso cuando hay una similitud de secuencia baja? ¿Hay algún algoritmo que construya el modelo de árbol preciso sin considerar la similitud de las secuencias?
Si trabaja con secuencias de codificación de proteínas y en el nivel de ADN son demasiado divergentes, entonces es mejor usar la secuencia de aminoácidos para la alineación y la reconstrucción filogenética.
Un mejor muestreo también puede ayudarlo, para esto puede consultar las bases de datos en línea con BLAST para encontrar secuencias similares que llenen el vacío.
El problema con las secuencias con una similitud de secuencia baja es que es difícil identificar posiciones/caracteres homólogos y todos los métodos basados en la alineación se basan en la suposición de que las posiciones alineadas son homólogas.
Finalmente, también hay algoritmos sin alineación. ( https://en.wikipedia.org/wiki/Alignment-free_sequence_analysis )
Hoy en día, las revistas generalmente requieren que ejecute un análisis de máxima verosimilitud (ML) o un análisis bayesiano . Ambos métodos se denominan basados en modelos. Los programas más comunes utilizados para estos son RAxML (ML) y MrBayes (Bayesian). Otro software común es MEGA (Análisis genético evolutivo molecular), que puede ejecutar diferentes algoritmos de construcción de árboles.
Por lo general, para una referencia rápida, la parsimonia máxima o los árboles de unión de vecinos son buenos. Para la publicación, un árbol de máxima verosimilitud es muy útil, ya que devuelve un solo mejor árbol. Mientras que el análisis bayesiano y la máxima parsimonia devuelven una colección de árboles.
También son útiles diferentes algoritmos y si todos devuelven árboles similares, puede estar más seguro acerca de las relaciones.
bli
Pravin Pojrel