Alineación de fragmentos secuenciados en secuenciación de próxima generación (ensamblaje de secuencia) [cerrado]

El NGS (Next Generation Sequencing) consiste en fragmentar el ADN a secuenciar. A esto le sigue la unión a perlas o celdas de flujo y luego se lleva a cabo una PCR localizada. Se añaden bases modificadas y con la adición de cada base se realiza una detección (por fluorescencia, por ejemplo) del tipo de base unida. Después de la secuenciación completa de todos los fragmentos, ¿cómo se ensamblan estas lecturas de fragmentos de la forma en que estaban en el ADN original no fragmentado? (en resumen: ¿Cómo funciona el ensamblaje de secuencias? )

Existen diferentes métodos de ensamblaje de secuencias. Para obtener una descripción general, puede leer esto: nature.com/nrg/journal/v14/n3/full/nrg3367.html

Respuestas (1)

El ensamblaje y la alineación generalmente se usan para referirse a dos algoritmos diferentes que funcionan de dos maneras diferentes.

La alineación toma sus fragmentos de secuencia, los compara con un genoma de referencia y le dice dónde se alinea esa lectura y qué tan cerca se alinea. Durante un tiempo, los alineadores populares utilizaron algoritmos de transformación de Burrows-Wheeler para crear versiones indexadas especiales del genoma, lo que hizo que la alineación con el índice fuera mucho más rápida.

El ensamblaje es cuando no tiene referencia y usa la superposición de las lecturas para construir grandes contigs. Durante un tiempo, los gráficos de De Brujin fueron un algoritmo popular para eso.