¿Cómo calculan los secuenciadores NGS/de alto rendimiento las puntuaciones de calidad?

Question

¿Cómo calculan los secuenciadores NGS/de alto rendimiento las puntuaciones de calidad?

Biología
genómica
secuencia ADN
alto rendimiento
análisis de secuencias

ShanZhengYang

Estoy confundido en cuanto a cómo los secuenciadores de ADN como Illumina calculan realmente las puntuaciones de calidad. Para cada llamada de base, se calcula algún valor predictivo de calidad, en función de varias propiedades de la máquina de secuenciación, como la intensidad de la luz durante la lectura.

¿Sabemos exactamente cómo se calculan estos puntajes de calidad? ¿Exactamente cuántos factores intervienen en el cálculo de estos valores CUAL?

usuario3234810

solo tengo experiencia con las plataformas de Illumina aquí hay un enlace a los conceptos básicos Información de calidad de Illumina Información más detallada de Illumina Eche un vistazo a las referencias en ese documento para profundizar más. (Supongo que no se refiere a puntajes de calidad de llamadas variantes que, en la canalización que uso, se manejan después de la secuenciación)

ShanZhengYang

@ usuario3234810 Gracias. Pero estaba buscando más información que eso. Existe cierta relación entre "señal a ruido" y puntajes de calidad. Cómo calcula Illumina exactamente esto, no lo sé.

WYSIWYG

Los cálculos de puntuación de calidad son diferentes para diferentes tipos de máquinas. ¿Específicamente interesado en Illumina?

ShanZhengYang

@WYSIWYG En realidad, cualquier secuenciador funcionaría. Acabo de mencionar Illumina como punto de partida.

WYSIWYG

@ShanZhengYang, sugeriría que restrinja su pregunta a un tipo de máquina (o tipos de máquinas con la misma técnica de llamada base). Puedes apegarte solo a Illumina. Además, incluso para illumina existen diferentes enfoques de llamada base.

ShanZhengYang

@WYSIWYG Eso es razonable. Mantengamos la discusión centrada en las llamadas de base con Illumina.

WYSIWYG

@ShanZhengYang Puedes echar un vistazo a mi respuesta

Respuestas (1)

¿Cómo calculan los secuenciadores NGS/de alto rendimiento las puntuaciones de calidad?

solo tengo experiencia con las plataformas de Illumina aquí hay un enlace a los conceptos básicos Información de calidad de Illumina Información más detallada de Illumina Eche un vistazo a las referencias en ese documento para profundizar más. (Supongo que no se refiere a puntajes de calidad de llamadas variantes que, en la canalización que uso, se manejan después de la secuenciación)
@ usuario3234810 Gracias. Pero estaba buscando más información que eso. Existe cierta relación entre "señal a ruido" y puntajes de calidad. Cómo calcula Illumina exactamente esto, no lo sé.
Los cálculos de puntuación de calidad son diferentes para diferentes tipos de máquinas. ¿Específicamente interesado en Illumina?
@WYSIWYG En realidad, cualquier secuenciador funcionaría. Acabo de mencionar Illumina como punto de partida.
@ShanZhengYang, sugeriría que restrinja su pregunta a un tipo de máquina (o tipos de máquinas con la misma técnica de llamada base). Puedes apegarte solo a Illumina. Además, incluso para illumina existen diferentes enfoques de llamada base.
@WYSIWYG Eso es razonable. Mantengamos la discusión centrada en las llamadas de base con Illumina.

WYSIWYG · Answer 1

Estoy restringiendo esta respuesta a Illumina. Incluso entonces, no conozco los detalles exactos del análisis de datos sin procesar (es un software propietario).

Básicamente, Illumina graba la secuencia a partir de imágenes fotográficas. Cada nucleótido tiene una etiqueta fluorescente distinta. En un ciclo, se bombea un nucleótido y se eliminan los nucleótidos no incorporados (esto se repite para todos los nucleótidos). Un láser excita el fluoróforo y la luz emitida se registra en forma de fotografía. La plantilla de ADN está presente en forma de grupos de hebras (en un lugar determinado), lo que permite una fácil identificación visual de la fluorescencia.

La llamada base se realiza mediante análisis de imágenes. Cada imagen se analiza en busca de intensidades de diferentes colores y, en base a esto, se calcula el puntaje de calidad. El puntaje de calidad es básicamente la probabilidad logarítmica de que un nucleótido ocurra en una posición dada (basado en la intensidad de su color) en comparación con otros nucleótidos.

Esta es la explicación más simple de cómo Illumina hace llamadas de base. Hay diferentes tipos de errores y sesgos y hay diferentes enfoques estadísticos para corregirlos.

Eche un vistazo a las siguientes referencias para obtener más detalles:

Ledergerber, Christian y Christophe Dessimoz. " Base-calling para plataformas de secuenciación de próxima generación ". Informes en bioinformática (2011): bbq077.
Curso Illumina MiSeq Imaging y Base Calling
Wiki de análisis del genoma

¿Cómo calculan los secuenciadores NGS/de alto rendimiento las puntuaciones de calidad?

ShanZhengYang

usuario3234810

ShanZhengYang

WYSIWYG

ShanZhengYang

WYSIWYG

ShanZhengYang

WYSIWYG

Respuestas (1)

WYSIWYG

¿Qué factores debo tener en cuenta al seleccionar un genoma de referencia para el mapeo?

Secuencia de referencia para definir polimorfismos de un solo nucleótido

¿Cómo se definen exactamente las brechas en la genómica?

Parámetros del análisis de llamadas de variantes [cerrado]

¿Es posible deducir hechos sobre los padres de una persona simplemente estudiando su genoma?

¿Qué aspecto tienen las lecturas finales emparejadas de Illumina HiSeq/MiSeq?

¿Dónde puedo encontrar datos de secuencias de ADN para el cáncer de colon?

¿Herramienta para la alineación de nucleótidos con todos los códigos de nucleótidos (por ejemplo, R, Y, W, S, etc.)?

¿Cuál es la diferencia entre la alineación de secuencias y el ensamblaje de secuencias?

¿La cobertura de secuenciación de ADN es una función de la pureza de la muestra?