¿Pueden los algoritmos exhaustivos producir MSA que sean adecuados para el modelado de estructuras 3D?

Mientras se predice la estructura 3D de una proteína a través del modelado de homología, el paso más importante es la alineación de secuencias múltiples de las secuencias molde con la proteína objetivo cuyo modelo 3D se va a predecir. En este paso, de acuerdo con mi libro para Alineación de secuencias múltiples, se usa el software T-coffee o Praline; estos programas son de naturaleza heurística y se basan en un método de alineación progresiva. Siempre hay preocupaciones con respecto a la sensibilidad y especificidad de los algoritmos heurísticos.

Para evitar ese problema imagino que una opción es utilizar algoritmos exhaustivos. Durante este paso de alineación, que es muy crítico en el modelado 3D, ¿podemos usar algoritmos exhaustivos para producir buenos modelos?

¿De qué algoritmos exhaustivos estás hablando? Encontrar el homólogo correcto es, AKAIK, un problema NP-completo y es por eso que se utilizan métodos heurísticos.
Estoy hablando del modelado de programación dinámica, ya que es exhaustivo.
@WYSIWYG, ¿puede explicar su respuesta, por favor, para que pueda desarrollar una mejor comprensión?
Los algoritmos heurísticos/codiciosos son más rápidos que DP. No soy un experto en informática para explicar esto en detalle. Puedes echar un vistazo a este SO post .

Respuestas (1)

No.

Los métodos para el alineamiento de secuencias múltiples (MSA) como T-coffee, que usted menciona, y Clustal ( http://www.clustal.org ), que también se usa ampliamente, emplean heurísticas para el alineamiento por la muy buena razón de que los algoritmos exhaustivos para hacer esto son NP-completos.

Usted menciona el algoritmo de programación dinámica como exhaustivo en su comentario. La alineación de dos secuencias por programación dinámica tiene un orden de complejidad temporal (O grande) de norte 2 y puede tomar algunos minutos dependiendo de la duración de la secuencia, etc. La alineación de tres tiene una gran O de norte 3 y se puede hacer si tiene mucho tiempo libre, pero debería ser obvio que ese es el límite para la cantidad de secuencias que se pueden alinear usando programación dinámica.

No hay vergüenza en la heurística. Quizás el programa de bioinformática más utilizado en el mundo, BLAST, emplea una heurística. (Y su cerebro toma decisiones de las que depende su vida todos los días usando heurística).

Los métodos que usan heurística para MSA se han modificado sucesivamente para tratar con factores conocidos que pueden causar problemas, por lo que a menudo funcionan muy bien. ¿Cómo puedes saberlo? Lo que debe hacer al usar los programas MSA es realizar una "comprobación de cordura" en cualquier alineación que produzcan los programas: ¿parece razonable, ha coincidido bien con regiones similares o se han introducido grandes brechas o se han perdido regiones obvias de homología? Y si está haciendo un modelado 3D y no obtiene una alineación que se vea bien, es probable que su modelado no funcione.

Finalmente, siempre debe considerar la posibilidad de que no haya proteínas de estructura conocida que sean similares a la que desea modelar, por lo que nunca obtendrá un buen MSA.