¿Cómo calculan los secuenciadores NGS/de alto rendimiento las puntuaciones de calidad?

Estoy confundido en cuanto a cómo los secuenciadores de ADN como Illumina calculan realmente las puntuaciones de calidad. Para cada llamada de base, se calcula algún valor predictivo de calidad, en función de varias propiedades de la máquina de secuenciación, como la intensidad de la luz durante la lectura.

¿Sabemos exactamente cómo se calculan estos puntajes de calidad? ¿Exactamente cuántos factores intervienen en el cálculo de estos valores CUAL?

solo tengo experiencia con las plataformas de Illumina aquí hay un enlace a los conceptos básicos Información de calidad de Illumina Información más detallada de Illumina Eche un vistazo a las referencias en ese documento para profundizar más. (Supongo que no se refiere a puntajes de calidad de llamadas variantes que, en la canalización que uso, se manejan después de la secuenciación)
@ usuario3234810 Gracias. Pero estaba buscando más información que eso. Existe cierta relación entre "señal a ruido" y puntajes de calidad. Cómo calcula Illumina exactamente esto, no lo sé.
Los cálculos de puntuación de calidad son diferentes para diferentes tipos de máquinas. ¿Específicamente interesado en Illumina?
@WYSIWYG En realidad, cualquier secuenciador funcionaría. Acabo de mencionar Illumina como punto de partida.
@ShanZhengYang, sugeriría que restrinja su pregunta a un tipo de máquina (o tipos de máquinas con la misma técnica de llamada base). Puedes apegarte solo a Illumina. Además, incluso para illumina existen diferentes enfoques de llamada base.
@WYSIWYG Eso es razonable. Mantengamos la discusión centrada en las llamadas de base con Illumina.
@ShanZhengYang Puedes echar un vistazo a mi respuesta

Respuestas (1)

Estoy restringiendo esta respuesta a Illumina. Incluso entonces, no conozco los detalles exactos del análisis de datos sin procesar (es un software propietario).

Básicamente, Illumina graba la secuencia a partir de imágenes fotográficas. Cada nucleótido tiene una etiqueta fluorescente distinta. En un ciclo, se bombea un nucleótido y se eliminan los nucleótidos no incorporados (esto se repite para todos los nucleótidos). Un láser excita el fluoróforo y la luz emitida se registra en forma de fotografía. La plantilla de ADN está presente en forma de grupos de hebras (en un lugar determinado), lo que permite una fácil identificación visual de la fluorescencia.

La llamada base se realiza mediante análisis de imágenes. Cada imagen se analiza en busca de intensidades de diferentes colores y, en base a esto, se calcula el puntaje de calidad. El puntaje de calidad es básicamente la probabilidad logarítmica de que un nucleótido ocurra en una posición dada (basado en la intensidad de su color) en comparación con otros nucleótidos.

Esta es la explicación más simple de cómo Illumina hace llamadas de base. Hay diferentes tipos de errores y sesgos y hay diferentes enfoques estadísticos para corregirlos.

Eche un vistazo a las siguientes referencias para obtener más detalles: