Tengo ChIP-seq para H3K79me2 y H3K36me3 y datos de RNA-seq para muestras tratadas y no tratadas. Esas dos histonas marcan genes activos. Digamos, hipotéticamente, que un llamador máximo encuentra sitios diferenciales en el gen A para ambas modificaciones de histonas. Sin embargo, cuando ejecuto herramientas de análisis de RNA-seq (como edgeR o DESeq2), este gen no está marcado como expresado diferencialmente (bueno, tiene un valor de FDR de> 0.05).
Puede haber varias razones técnicas para que los métodos de análisis de RNA-seq no encuentren este gen expresado diferencialmente porque
Sin embargo, estoy más interesado en el aspecto biológico. Si dos histonas marcan el gen A como activo en muestras tratadas, cabría esperar que se expresara en RNA-seq. ¿Qué mecanismo podría conducir al resultado de que, aunque las histonas marquen el gen como activo, no se exprese de manera diferencial en RNA-seq?
Es difícil sacar alguna conclusión sin más experimentación. Puede haber muchos otros factores que impidan la expresión del gen, incluidos factores como los reguladores postranscripcionales. Algunas modificaciones de histonas como las que mencionas también son un poco arriesgadas y también puede haber modificaciones bivalentes. Sin embargo, si hay una razón sólida para especular que estas marcas están asociadas con la represión, puede probar estas:
Puedes verificar cuántos genes hay cuya expresión no está de acuerdo con las marcas de histonas. Si se trata de una pequeña cantidad de genes, puede investigarlos por separado. Use una prueba estadística para verificar la importancia de su correlación entre la marca de histonas y la expresión. Si la discordancia es generalizada, le sugiero que repita el RNAseq (más fácil y más barato que repetir el ChIP-seq). Por cierto, ¿cómo fueron las cualidades de lectura? Dependiendo de eso, puede decidir qué experimento necesita repetición. La repetición te ayudará a saber si la observación es realmente correcta (una réplica biológica); posiblemente también puede llegar a la conclusión de que estas marcas son realmente peligrosas.
Si algunos genes muestran discordancia, simplemente realice PCR en tiempo real para estos genes. RT-PCR es más sensible y otra técnica de cuantificación es igualmente buena. Use algunos genes concordantes también en el experimento.
ChIP-seq no es perfecto. Incluso entre réplicas técnicas, obtiene una buena cantidad de variación, especialmente para marcas anchas como las que está usando. Es bastante raro ver a personas usar H3K79me2 y H3K36me3 para determinar si un gen se expresa o no. El uso de H3K4me3 y H3K27ac o H3ac es un método más común para marcar promotores de genes transcritos.
40 genes discordantes no me preocuparían mucho a menos que realmente tenga lecturas bajas para cualquier conjunto de experimentos de secuenciación. La sugerencia de @WYSIWYG de usar RT-PCR para verificar sus datos de RNA-seq para algunos genes es buena.
perry