Diferencia entre datos de RNA-seq específicos de cadena y no específicos de cadena

Me gustaría preguntar la diferencia entre el conjunto de datos específico de hebra y no específico de hebra.

Hasta donde yo sé, los datos específicos de cadena significan que sabemos de qué cadena proviene la transcripción.

No tengo antecedentes biológicos. Por favor, confirme si es correcto. Si tenemos una transcripción, que es de cadena sentido, cuando RNA-seq está produciendo lecturas, es que primero se sintetiza el cDNA. ¿Entonces este cDNA se usa para PCR para amplificar la muestra? Entonces, ¿las lecturas generadas podrían ser de ambas cadenas del ADN original?

Para los protocolos específicos de hebra, ¿qué es diferente?

================================================== ======

Hacer un seguimiento.

Por favor, corríjame si estoy equivocado. Existen múltiples protocolos para producir bibliotecas de RNA-seq específicas de cadena. El proceso básico es como:

  1. Obtener el ARN;
  2. Obtener su ADNc;
  3. De alguna manera marcar el cDNA como sentido o antisentido al amplificar (¿PCR?) (aquí vienen las diferencias entre los diferentes protocolos);
  4. A continuación, ELIMINAR todos los ADNc antisentido (o sentido);
  5. Lea las lecturas de la biblioteca de cDNA limpia.

El resultado es que las lecturas de este ARN se pueden usar para ensamblar el ADNc sentido. Y para las bibliotecas no específicas de cadena, el uso de las lecturas podría ensamblar tanto el ADNc antisentido como el sentido.

¿Tengo razón sobre este problema? Gracias.

publicación cruzada (primero cerrada, luego reabierta...) biostars.org/post/show/43507/…

Respuestas (1)

Puede valer la pena consultar el documento " Análisis comparativo completo de métodos de secuenciación de ARN específicos de hebras ".

Las técnicas más comunes ligan secuencialmente diferentes adaptadores de ARN a los extremos 5' y 3' de cada molécula de ARN antes de la síntesis de ADNc. Terminarás con una molécula de ARN que se ve así (donde A y B son los dos adaptadores):

  5'-AAAAAA---------------BBBBBB-3'

Estos adaptadores se utilizan luego para la síntesis de ADNc y la preparación de bibliotecas. Finalmente, dado que cada adaptador está ligado a un extremo específico del ARN, la biblioteca se puede generar de una manera específica para el soporte; es decir. las lecturas derivadas de la hebra antisentido deben alinearse con la hebra antisentido del genoma.

** Tenga en cuenta que existen otras variaciones de esta técnica, pero el protocolo de Illumina es uno de los más populares.

Gracias, @GWW. ¿Significa que Illumina proporcionará dos bibliotecas (una antisentido y otra sentido) a los usuarios? ¿O simplemente marcan cada lectura de qué sentido proviene? Al dar lecturas a los clientes, ¿han quitado los adaptadores de antemano? ¿O los usuarios necesitan eliminar por sí mismos?
Por cierto, revisé el papel... Pero no puedo encontrar mucho sobre el procesamiento posterior de los datos...
¿Te refieres a alinear las lecturas?
Quiero decir, dijiste que "las lecturas derivadas de la hebra antisentido deberían alinearse con la hebra antisentido del genoma", entonces, ¿qué proporcionaría Illumina? Si solo proporcionan cualquier lectura, eso no es específico de la hebra, ¿verdad? Deben filtrar las lecturas con sentido o sin sentido, o pueden marcar cada lectura como si se trata de un hilo con sentido o sin sentido. ¿Tengo razón?
No, después de la alineación, las lecturas derivadas de la hebra antisentido solo deben alinearse con la hebra antisentido del genoma (lo mismo para las lecturas de la hebra sentido). Con una preparación estándar de RNA-seq, las lecturas podrían alinearse con cualquiera de las cadenas, lo que le impide inferir la cadena real de la que se deriva la lectura.
Gracias por su paciencia, @GWW. Sí, las lecturas de la hebra antisentido deben estar alineadas con el ADN antisentido. Entonces, dada una lectura, SABEMOS que esta lectura DEBE ser de qué hebra, ¿verdad?
Sí, asumiendo que las bibliotecas se prepararon usando una biblioteca direccional.