Soy muy nuevo en el área de la biología, así que lo siento si esta es una pregunta estúpida.
Tengo datos de RNA-Seq realizados durante un lapso de 100 días y tengo datos de expresión génica en el siguiente formato. Cada valor de expresión es la media de 3 repeticiones.
Day 1 Day 10 Day50 Day 100
Gene 1 12 42 35 12
Gene 2 50 53 23 100
. . . . .
. . . . .
. . . . .
así sucesivamente, los datos anteriores son solo algo que se me ocurrió, pero ¿puede decirme qué información puedo extraer de este tipo de datos? Como la expresión diferencial de genes. Muchas gracias
Puede ser complicado porque los datos de RNA-seq analizan la expresión génica, en forma de mRNA. Pero hay miles de genes domésticos que se expresan constantemente, mientras un organismo está vivo. Entonces, los genes realmente interesantes en un curso de tiempo son aquellos que se expresan diferencialmente. Así que el gen 1, en tu ejemplo, no es tan interesante. El gen 2, sin embargo, presenta un aumento de 4 veces entre el día 50 y el día 100. Aún así, eso no es tan grande. Necesitas programas de computadora para resolver todo esto. Pero lo que quieres es poder asociar un gran cambio en el ARNm (expresión génica) que se pueda distinguir del fondo.
Nunca he visto personas extrayendo datos de datos, tal vez quiso decir qué tipo de información podría querer extraer y la respuesta es "genes expresados diferencialmente". Debe verificar si sus datos están normalizados o no, si lo están, puede usar el popular paquete R como DEseq2 o Limma para detectar genes expresados diferencialmente. En caso de que sus datos no se hayan normalizado, estas herramientas tienen la forma adecuada de normalizar su matriz.
Aquí está el enlace de limma: https://www.bioconductor.org/packages/devel/bioc/vignettes/limma/inst/doc/usersguide.pdf
en la página 46 tiene un ejemplo de cómo manejar el análisis del curso del tiempo
bli