¿Conjuntos de datos estándar para probar nuevos algoritmos de alineación de secuencias múltiples?

¿Existen conjuntos de datos estándar abiertos y distribuidos libremente para probar nuevos algoritmos para la alineación de secuencias múltiples ?

Bienvenidos a Biología Beta @msa!!! Gracias por hacer la maravillosa pregunta, pero le sugiero que cierre cualquiera de las que hizo, ya que son duplicados entre sí.
Siempre me he preguntado sobre esto, ¡así que sería genial obtener una respuesta detallada! pero por el momento, ¿no podría observar una proteína conocida o una secuencia de ADN como Ras dentro de un organismo o de diferentes especies y alinearlas? La mejor manera de hacerlo es ir a UniProt ( uniprot.org ) y escribir una proteína como Ras. Una vez que seleccione un Ras en particular, debajo de las bases de datos filogenómicas puede seleccionar OrthoDB y una vez que ingrese a la página, puede seleccionar obtener FASTA o Delimitado por tabuladores en la parte superior de la página.
@DevashishDas Esta pregunta no es un duplicado de la pregunta vinculada, ya que solicita un conjunto de datos estándar para que msa pruebe un nuevo algoritmo y la pregunta anterior no se responde hasta donde puedo decir, ¡así que no es de mucha ayuda!
@Bez: Está bien. Pero parecen terriblemente vinculados, podrían formularse en una sola pregunta. De todos modos, intentaré responder a ambas.

Respuestas (1)

Le sugeriría PAcAlCI o Predicción de precisión en alineaciones basada en inteligencia computacional , aunque el acrónimo en wierd la herramienta es buena para probar nuevas alineaciones de secuencia. Ellos

Pero antes de comenzar a probar su algoritmo, le sugiero que eche un vistazo a estos documentos:

[1] ¿Quién vigila a los vigilantes? Una evaluación de puntos de referencia para la alineación de secuencias múltiples

[2] Problemas en la evaluación comparativa de la bioinformática: el estudio de caso de la alineación de secuencias múltiples

PD: No he probado ni usado la herramienta yo mismo.