¿La cobertura de secuenciación de ADN es una función de la pureza de la muestra?

¿Cómo se ve afectada la cobertura por la pureza de una muestra? ¿Y la cobertura de una muestra puede verse afectada por otras cosas, como la preparación de la biblioteca o la forma en que se almacenó la muestra?

La cobertura se ve afectada básicamente por la concentración de las hebras en la biblioteca. Puede verse afectado en cualquiera de los varios pasos de aislamiento de ADN, preparación de bibliotecas y secuenciación.

Respuestas (2)

Entonces, factores que entran en la cobertura de la secuenciación de lectura corta (y la secuenciación de Sanger).

  • La profundidad es la obvia. En igualdad de condiciones, se obtiene una distribución de cobertura de Poisson sobre un genoma, razón por la cual más secuenciación = más cobertura.

  • El genoma humano y el transcriptoma no son todos iguales. La secuenciación de Illumina depende en última instancia (la mayoría de los protocolos) de la amplificación por PCR, lo que significa que cualquier factor que influya en la capacidad de amplificación por PCR también afectará la profundidad de la secuenciación. Los dos obvios a este respecto son: 1) Regiones de contenido extremo de GC y 2) Regiones que contienen estructuras secundarias (ARN principalmente).

  • La alineación es la siguiente fuente importante de error para las regiones que se "eliminan" dependiendo de cómo su alineador trata las lecturas de mapeo múltiple. Algunos genomas tienen elementos transponibles muy jóvenes, muy similares entre sí y muy abundantes. Para la mayoría de los alineadores, eso significa que puede obtener una cobertura enorme o una cobertura realmente pequeña dependiendo de cómo se ensamble el genoma.

  • Para las técnicas de secuenciación de entrada baja, obtiene fuentes importantes de contaminación de ADN/ARN de las enzimas, los reactivos y la preparación de las muestras. Esto se puede minimizar en gran medida teniendo muestras "limpias" y utilizando grandes cantidades de ADN/ARN de entrada.

Dependiendo de las secuencias que estés estudiando, la profundidad de lectura puede ser el único factor que consideres o si tienes regiones difíciles o preguntas específicas, puedes lidiar con una gran cantidad de problemas.

Entonces, en respuesta a su pregunta: sí, la calidad del ADN afectará directamente la cobertura. A veces puede "simplemente secuenciar más" para superar este problema, a veces necesita volver a la mesa de dibujo.

El mayor contribuyente a la cobertura de secuenciación (en un Hiseq, supongo) es la cantidad de lecturas que obtiene, que depende principalmente del porcentaje de una celda de flujo que le da. Obviamente, el resto que mencionó contribuye, y la pureza puede ser un gran problema si está buscando un subconjunto de celdas que estaba tratando de aislar de un grupo más grande, pero la forma más fácil de obtener más cobertura es acumular más bienes raíces en la celda de flujo.

No entiendo lo que quiere decir con porcentaje de celda de flujo. ¿Podría explicarlo brevemente?
Si no está hablando de tecnología de lectura corta, entonces es más aplicable. Obviamente, lo más directo que contribuye a la cobertura es cuántas lecturas tiene. Más lecturas, más cobertura.