aplicaciones de montaje de novo

Oye, espero que esta pregunta se suponga que esté en este foro.

No soy de la comunidad de biología, soy de la comunidad de seguridad de datos, por lo que no estoy familiarizado con las palabras que podría usar para las respuestas.

Necesito usar un algoritmo muy similar al algoritmo de ensamblaje de novo . Trataré de explicarme mejor. Tengo algunas secuencias de '1' y '0', todas ellas son piezas de una gran secuencia.

He visto algunas aplicaciones que funcionan con este algoritmo, como SPAdes tadpole y Geneious, pero no pude hacer que ninguna de ellas funcionara para mí, excepto Geneious porque era la más simple.

Geneious no es bueno para mí porque necesito algo que pueda usar por línea de comando en la terminal. ¿Qué aplicación me recomiendan usar? Ingreso las secuencias y la salida será la secuencia grande.

Por cierto, en Geneious he usado un archivo FASTA para mi secuencia donde mi '0' y '1' se tradujeron a 'C' y 'D'

Muchas gracias espero sus respuestas :))

¿Puede explicar qué tipo de datos está tratando de ensamblar de novo? Nunca he oído hablar de algo así antes.

Respuestas (1)

Puede probar Velvet , pero probablemente terminará con miles de contigs a menos que su genoma de referencia esperado sea bastante simple. Esta pregunta aborda muchas de las dificultades del ensamblaje de novo . Tampoco estoy seguro de lo que quieres decir con esto:

Por cierto, en Geneious he usado un archivo FASTA para mi secuencia donde mi '0' y '1' se tradujeron a 'C' y 'D'

¿Está tratando de usar esto para un propósito que no sea el ensamblaje del genoma real? Dices que eres del campo de la seguridad de datos, por lo que no está claro cuál es tu objetivo final. Si solo tiene una secuencia binaria, es mejor que tenga una longitud de lectura realmente larga y espere que no haya demasiadas repeticiones o realmente tendrá problemas para encontrar una secuencia de consenso.