Tengo datos de ARN Seq de piel humana y de ratón (2 réplicas cada uno) y quiero comparar la expresión de los genes ortólogos para encontrar alguno que se exprese de forma diferencial. He normalizado cuantil la matriz de expresión génica en las 4 muestras (2 ratones + 2 humanos). Eventualmente quiero calcular el cambio logarítmico en la expresión de todos los genes ortólogos entre las 2 especies. Sin embargo, antes de hacer esto, debo controlar la longitud del gen, ¿verdad? ¿Será esto suficiente para darme una idea de los genes expresados diferencialmente o debería emplear métodos más sofisticados? Cualquier comentario sería útil. Muchas gracias.
Depende del tipo de datos que tengas, realmente. Hay métodos desarrollados únicamente para cuantificar la expresión relativa basada en datos de conteo, como el uso de edgeR o limma-voom.
No necesita corregir la longitud del gen para estimar los cambios de expresión relativa, lo que debe hacer es normalizar primero por el tamaño de la biblioteca (y en el proceso obtener log2 ((recuentos + 0.5)/1e+06) y luego , siguiendo la normalización del cuantil, puede calcular ratón - humano o humano - ratón para obtener una estimación del cambio de pliegue.
Sin embargo, aún recomendaría usar algo un poco más sofisticado como limma-voom para esta tarea, porque eso también le permitirá obtener cosas como tasas de descubrimiento falso para sus cambios de pliegue.
MattDMo