Hoy un colega mío hizo la siguiente pregunta:
"Suponiendo que necesito construir desde 0, un cromosoma de un pez, con lecturas cortas pero sin ninguna otra referencia [ensamblaje de novo] :
- cuanto trabajo es eso
- ¿Existe un software genérico (como SAMtools) que alineará las lecturas en un andamio que se pueda usar?
- Básicamente, dada una tubería razonablemente clara en términos de software, ¿sigue siendo sangre, sudor y lágrimas o es solo una cuestión de colocarlo en un clúster?
Muy agradecido por cualquier sugerencia, fuentes de información, software, etc.
Puede intentar buscar en biostars.org, que es como stackexchange, pero para bioinformática.
Velvet es un ejemplo de un ensamblador de novo.
Pero 30 pb es muy poco, y los animales tienen genomas grandes (no tan resistentes como muchas plantas y hongos, pero aún así)
Lo que obtendrías es un bazillion de contigs cortos. No sería bonito.
Si solo quieres usar solo técnicas de secuenciación, tienes un problema.
Para tener una idea de qué tipo de resultados esperar, considere este artículo publicado recientemente en Nature Genetics. Intentaron ensamblar un genoma de ballena de novo. Tenían 7 (!) bibliotecas de extremos emparejados con diferentes longitudes de inserción que van desde 170 pb a 20 kb. Las longitudes de lectura fueron en su mayoría de 100 pb y, en algunos casos, de 49 pb. La cobertura promedio del genoma fue 91x.
Al ensamblar estos datos extensos, terminan con más de 100,000 contigs cuando se realiza el ensamblaje.
Por lo tanto, realmente no se puede ensamblar un genoma complejo (es decir, grande) de alta calidad a partir de datos de secuenciación de lectura corta utilizando las técnicas estándar.
Dicho esto, los enfoques recientes, como las bibliotecas con longitudes de lectura mucho más largas ( aquí ) o el uso de datos Hi-C ( aquí y aquí ) ofrecen una forma de obtener ensamblajes de genomas complejos de alta calidad utilizando solo datos de secuenciación.
Me gusta mucho el paquete de software genious. Puede multiproceso y realmente usar el rendimiento de su computadora. Incluso las cosas complicadas como el montaje De Novo son muy, muy intuitivas.
Konrad Rodolfo
Tomas Ingalls
hola_ahí_andy
Tomas Ingalls