Usando la plataforma Illumina, es barato y (relativamente) fácil secuenciar grandes cantidades de ADN o ARN. Existen otras plataformas (Roche/454, SOLiD, PacBio, Ion Torrent), cada una con sus propias ventajas, pero Illumina parece ser bastante popular para muchas aplicaciones, a pesar de sus limitaciones.
Idealmente, nos gustaría una tecnología de secuenciación que produzca lecturas largas y sin errores con un alto rendimiento. Sin embargo, en este punto parece que tenemos que hacer una elección: rendimiento o duración (y calidad). PacBio parece prometedor, pero lo último que escuché es que aún no han podido cumplir con sus afirmaciones.
¿Cuáles son las limitaciones moleculares y bioquímicas de nuestras tecnologías de secuenciación actuales? ¿Por qué no tenemos ya lecturas largas y sin errores con alto rendimiento?
Parece que respondió a su propia pregunta, la señal de unas pocas moléculas que pasan por una enzima o una polimerasa tiende a desincronizarse después de unos cientos de bases. Si una enzima para la secuenciación fuera más rigurosa en el tiempo, eso podría ayudar, por ejemplo. Las máquinas leen rastros en cuatro canales con buenos golpes para cada base. Vea este artículo para un buen ejemplo. Puedes ver que si hay demasiadas bases consecutivas, es difícil saber cuántas bases hay. Con el tiempo, los cuatro rastros comenzarán a borrarse y no puedes distinguir a Adam de Thelma si entiendes lo que quiero decir.
Pero hay otros cuellos de botella.
Actualmente, los secuenciadores emiten un volumen de datos tan alto que el análisis del significado de los datos de salida no se puede analizar lo suficientemente rápido. Esto sigue la tendencia en biotecnología durante los últimos 12 años más o menos: más datos de secuencias, datos de micromatrices, más datos de mutaciones, más genomas que personas que realmente pueden usarlos para comprender la biología. Ahora hay un pequeño cuello de botella en el análisis.
Por lo tanto, algunos de estos secuenciadores tienen mayores longitudes de lectura, lo que puede facilitar el ensamblaje de una secuencia. Estos secuenciadores generalmente cuestan más. Por ejemplo, si tiene una biblioteca para secuenciar un pequeño genoma de hongos o algas, obtendrá la respuesta en un día o menos ahora. En forma de 1 Tb de lecturas, quizás de 50 a 200 pb de largo. Podría tomar bastante tiempo juntar eso en una nueva secuencia genómica, aún más encontrar los genes, construir las redes de genes a partir de una plantilla de vías, etc. Imagínense miles de secuenciadores bombeando día y noche y obtendrán la imagen que estoy tratando de pintar aquí.
Sobre el costo. Ion Torrent y los nuevos secuenciadores Oxford Nanopore son realmente baratos: entre $ 50 mil y quizás $ 900 por el secuenciador USB de Oxford Nanopore. La mayoría de los otros sistemas cuestan cientos de miles de dólares. Ion torrent y Nanopore tienen más elementos desechables: tiras un chip o incluso todo el secuenciador, a un costo de cientos de dólares por muestra.
P1) ¿Cuáles son las limitaciones moleculares y bioquímicas de nuestras tecnologías de secuenciación actuales?
A1) AFAIK:
Illumina tiene dificultades para producir lecturas largas (aunque ahora miseq puede generar lecturas de 300 pb y que se pueden emparejar, el llamado extremo emparejado 2X300) porque después de una cierta cantidad de bases que se sintetizan y graban en cámara (Illumina está secuenciando por síntesis , básicamente agrega bases y mide la fluorescencia en cada ciclo), es decir, después de un cierto número de "ciclos" puede perder la sincronización y la calidad de las bases disminuye.
PacBio puede generar moléculas muy largas, pero todavía tienen grandes problemas con la confiabilidad de la lectura de las bases (no sé cuál es el problema aquí)
P2) ¿Por qué no tenemos ya lecturas largas y sin errores con alto rendimiento?
A2) ¡Porque es difícil de hacer! ¡Pero nos estamos moviendo hacia esto!
kmm
Daniel Standage
yotiao
Daniel Standage
yotiao