¿Qué algoritmo para encontrar la relación evolutiva de 5 secuencias?

Después de la Alineación de secuencias múltiples (MSA), se producen conjuntos de datos en los que se utilizan modelos de evolución. He visto en libros que si hay una gran similitud entre las secuencias, se usa la máxima parsimonia (MP), si es baja, entonces se usa la evolución mínima, y ​​si hay una similitud muy débil, se usa el método basado en la distancia. Sin embargo, todos estos tienen sus propias desventajas. Dado que los métodos basados ​​en caracteres son más confiables (como en el libro), ¿se pueden usar estos métodos incluso cuando hay una similitud de secuencia baja? ¿Hay algún algoritmo que construya el modelo de árbol preciso sin considerar la similitud de las secuencias?

¿Cómo se mide la similitud de secuencias? ¿A qué libro te refieres?
¿Alineación de secuencias múltiples? Montaje DW, secuencia bioinformática y análisis del genoma.

Respuestas (1)

Si trabaja con secuencias de codificación de proteínas y en el nivel de ADN son demasiado divergentes, entonces es mejor usar la secuencia de aminoácidos para la alineación y la reconstrucción filogenética.

Un mejor muestreo también puede ayudarlo, para esto puede consultar las bases de datos en línea con BLAST para encontrar secuencias similares que llenen el vacío.

El problema con las secuencias con una similitud de secuencia baja es que es difícil identificar posiciones/caracteres homólogos y todos los métodos basados ​​en la alineación se basan en la suposición de que las posiciones alineadas son homólogas.

Finalmente, también hay algoritmos sin alineación. ( https://en.wikipedia.org/wiki/Alignment-free_sequence_analysis )

En general sobre algoritmos para filogenética:

Hoy en día, las revistas generalmente requieren que ejecute un análisis de máxima verosimilitud (ML) o un análisis bayesiano . Ambos métodos se denominan basados ​​en modelos. Los programas más comunes utilizados para estos son RAxML (ML) y MrBayes (Bayesian). Otro software común es MEGA (Análisis genético evolutivo molecular), que puede ejecutar diferentes algoritmos de construcción de árboles.

Por lo general, para una referencia rápida, la parsimonia máxima o los árboles de unión de vecinos son buenos. Para la publicación, un árbol de máxima verosimilitud es muy útil, ya que devuelve un solo mejor árbol. Mientras que el análisis bayesiano y la máxima parsimonia devuelven una colección de árboles.

También son útiles diferentes algoritmos y si todos devuelven árboles similares, puede estar más seguro acerca de las relaciones.

¿Puede agregar fuentes para permitir que los usuarios lean en segundo plano su respuesta? ¿Podría decirnos los beneficios de los métodos descritos en términos de la pregunta? Por ahora, parece más un comentario general que una respuesta.
Agregué una parte un poco más específica a la respuesta. No sé exactamente de referencia para lo que escribí en la parte general. Es lo que escucho de colegas y veo en publicaciones actuales.