Secuenciación inexacta en el sitio del cebador

Las veces que he enviado una muestra para secuenciar, tanto el sitio del cebador directo como el inverso, muestran una gran imprecisión mientras que el resto del gen está secuenciado correctamente. Debido a esto, las secuencias de mi construcción in silico y la muestra secuenciada no se alinean en esta sección; pero se alinean en el resto del gen casi al 100%.

¿Hay alguna razón para esto? ¿Es esto simplemente un artefacto de secuenciación o debo confiar en la muestra secuenciada y asumir que los sitios del cebador han mutado?

El comienzo siempre es basura, puedes ignorarlo con seguridad. Sin embargo, el hecho de que tenga un resultado de secuenciación significa que el extremo 3' de su cebador coincide con la plantilla.

Respuestas (1)

Los mismos extremos de las lecturas de secuenciación obtenidas por la mayoría, si no todas, las tecnologías de secuenciación suelen ser de menor calidad, aunque con más frecuencia en la región 5'. Debe ignorar estos datos, o mejor aún, diseñar cebadores adicionales más lejos para encapsular esa región también si lo necesita desesperadamente.

A continuación se muestra un resultado bastante típico del análisis FASTQC de los datos de secuenciación de Illumina. Puede ver cómo la calidad está en su punto máximo en el medio de la lectura (índice base en el eje x). Es probable que vea algo similar para la secuenciación de Sanger, que presumiblemente es lo que está usando.

ingrese la descripción de la imagen aquí

¿Qué significaría una buena puntuación? y ¿cuál sería una buena puntuación? Me imagino por los colores que cualquier cosa en verde es buena, pero solo para saber un poco más sobre la secuencia.
Puede variar según la tecnología de secuenciación, pero la mayoría de los técnicos en estos días usan algo llamado puntuación "Phred-33". Es una relación logarítmica que, en términos generales, significa que una puntuación de Phred de 30 (en el eje Y en la imagen de arriba) significa que solo hay una probabilidad de 1 en 1000 de que la base se haya llamado incorrectamente. La mayoría de la gente acepta 30 como una calidad razonable para la secuenciación, también ayudado por el hecho de que tiene muchos millones de lecturas superpuestas (en NGS), por lo que incluso si una base se llama incorrectamente en 1 lectura, es probable que haya muchas otras lecturas que pueda consultar. a eso tendría la llamada correcta.