¿Por qué habría un aumento en la cobertura dentro de un gen en los datos de secuenciación de ARN? [cerrado]

Estoy buscando datos de secuencias de ARN en Geneious para Salmonella typhimurium y ocasionalmente veo un aumento en la cobertura de una secuencia de ARN dentro de un gen. ¿Por qué hay una sección del gen que parece transcribirse con mucha más frecuencia que cualquier otra parte? El nombre del gen en cuestión es ftsI, que es una proteína de división celular esencial que puede vincular las proteínas de división celular citoplasmáticas aguas arriba con las proteínas de división celular periplásmicas aguas abajo.

Bienvenido a SE Biología. Su pregunta parece potencialmente aceptable, sin embargo, necesita algunas modificaciones antes de que pueda obtener una respuesta. Mientras tanto, corre el riesgo de ser eliminado como "no está claro lo que quiere decir". Primero, no tenía idea de lo que era geneious. Debe poner mayúsculas en el software propietario e indicar de qué se trata. Más importante aún, debe incluir una imagen del pico que está viendo e indicar qué organismo es. No se puede esperar que sepamos qué es ftsl, y CDS no es el nombre de un gen sino un acrónimo de "secuencia de codificación". Por favor, edítalo.

Respuestas (2)

Sin saber cómo se han preparado y secuenciado sus bibliotecas, es difícil saber si se debe a una fuente técnica o biológica.

Sin embargo, hay algunas fuentes de sesgo en RNA-seq (que no son un problema en DNA-seq)

Una de ellas es que si usaste un protocolo de "hexámero aleatorio", se sabe que no son tan aleatorios después de todo. Ver: Hansen KD, Brenner SE, Dudoit S. Sesgos en la secuenciación del transcriptoma de Illumina causados ​​por cebado aleatorio de hexámeros. Ácidos Nucleicos Res. 2010;38: e131.

También podría tener una contaminación de otras especies que presentaría una identidad de secuencia para esa parte más específicamente.

Algunas regiones pueden estar más presentes que otras en los datos de secuenciación porque algunos exones pueden incluirse más a menudo en la transcripción madura (empalme alternativo). Compruebe si los picos coinciden con los exones. Editar: es probable que este no sea el caso, ya que se trata de una bacteria: hasta donde yo sé, el empalme es muy poco común en las bacterias

Otra posible explicación podría ser que existen sesgos durante la preparación o secuenciación de la biblioteca.

En ambos escenarios, los sesgos serían postranscripcionales.

Otra posibilidad sería que otras unidades de transcripción estén presentes dentro de su gen de interés. Esto sucede a veces, especialmente cuando se trata de genomas compactos.

Salmonella no tendría exones/intrones.
@ emilliman5 De hecho, no había tenido en cuenta el hecho de que la pregunta del cartel involucraba una bacteria.