¿Qué información se puede extraer del transcurso del tiempo de los datos de RNA-Seq?

Soy muy nuevo en el área de la biología, así que lo siento si esta es una pregunta estúpida.

Tengo datos de RNA-Seq realizados durante un lapso de 100 días y tengo datos de expresión génica en el siguiente formato. Cada valor de expresión es la media de 3 repeticiones.

           Day 1         Day 10     Day50     Day 100
Gene 1      12             42         35       12
Gene 2      50             53         23       100
.           .              .          .        .   
.           .              .          .        .   
.           .              .          .        .

así sucesivamente, los datos anteriores son solo algo que se me ocurrió, pero ¿puede decirme qué información puedo extraer de este tipo de datos? Como la expresión diferencial de genes. Muchas gracias

Tenga en cuenta que también hay un sitio bioinformatics.stackexchange.com.

Respuestas (2)

Puede ser complicado porque los datos de RNA-seq analizan la expresión génica, en forma de mRNA. Pero hay miles de genes domésticos que se expresan constantemente, mientras un organismo está vivo. Entonces, los genes realmente interesantes en un curso de tiempo son aquellos que se expresan diferencialmente. Así que el gen 1, en tu ejemplo, no es tan interesante. El gen 2, sin embargo, presenta un aumento de 4 veces entre el día 50 y el día 100. Aún así, eso no es tan grande. Necesitas programas de computadora para resolver todo esto. Pero lo que quieres es poder asociar un gran cambio en el ARNm (expresión génica) que se pueda distinguir del fondo.

Hola Karl, gracias por tu respuesta, necesito mencionar que cada valor de expresión que tengo es el valor medio de rpkm de 3 repeticiones. Así que el cambio de expresión no se debe al ruido biológico. Sí, estaba pensando en usar R para quizás clasificar los genes por los puntos de tiempo durante los cuales tienen la máxima expresión.
Aunque hay réplicas, eso no significa que haya eliminado el ruido, solo redujo una de las muchas fuentes diferentes de ruido. Debe tener datos para los genes de mantenimiento que puede usar para normalizar los números de genes; ver por ejemplo esta pregunta y respuesta

Nunca he visto personas extrayendo datos de datos, tal vez quiso decir qué tipo de información podría querer extraer y la respuesta es "genes expresados ​​​​diferencialmente". Debe verificar si sus datos están normalizados o no, si lo están, puede usar el popular paquete R como DEseq2 o Limma para detectar genes expresados ​​​​diferencialmente. En caso de que sus datos no se hayan normalizado, estas herramientas tienen la forma adecuada de normalizar su matriz.

Aquí está el enlace de limma: https://www.bioconductor.org/packages/devel/bioc/vignettes/limma/inst/doc/usersguide.pdf

en la página 46 tiene un ejemplo de cómo manejar el análisis del curso del tiempo

Sí, eso es exactamente lo que quiero decir, quiero saber qué información puedo extraer. Pero dado que cada punto de datos es la media de 3 repeticiones, ¿es posible encontrar los genes expresados ​​​​diferencialmente? ¡Gracias por liderar DESeq y Limma!
Sí, por supuesto que puedes, hubiera sido mejor si tuvieras todas las réplicas de cada muestra, pero tienes que conformarte con lo que tienes a menos que las personas en el laboratorio puedan darte los datos sin procesar. Por favor revise la nueva respuesta. Te he señalado a qué página tienes que ir para realizar el análisis.
si esta respuesta respondió a su pregunta, marque la pregunta como respondida. Mejor