ChIP-seq para la modificación de histonas no está de acuerdo con RNA-seq para la expresión

Tengo ChIP-seq para H3K79me2 y H3K36me3 y datos de RNA-seq para muestras tratadas y no tratadas. Esas dos histonas marcan genes activos. Digamos, hipotéticamente, que un llamador máximo encuentra sitios diferenciales en el gen A para ambas modificaciones de histonas. Sin embargo, cuando ejecuto herramientas de análisis de RNA-seq (como edgeR o DESeq2), este gen no está marcado como expresado diferencialmente (bueno, tiene un valor de FDR de> 0.05).

Puede haber varias razones técnicas para que los métodos de análisis de RNA-seq no encuentren este gen expresado diferencialmente porque

  1. en realidad no se expresa diferencialmente
  2. o no se expresa lo suficientemente diferencialmente para que las herramientas lo detecten

Sin embargo, estoy más interesado en el aspecto biológico. Si dos histonas marcan el gen A como activo en muestras tratadas, cabría esperar que se expresara en RNA-seq. ¿Qué mecanismo podría conducir al resultado de que, aunque las histonas marquen el gen como activo, no se exprese de manera diferencial en RNA-seq?

Su afirmación de que esas dos modificaciones postraduccionales de histonas marcan genes activos no está respaldada por su evidencia experimental (en todos los casos). Tal vez una declaración más precisa sería algo así como "a menudo marcan genes activos" o "¿se asocian típicamente con genes activos?"

Respuestas (2)

Es difícil sacar alguna conclusión sin más experimentación. Puede haber muchos otros factores que impidan la expresión del gen, incluidos factores como los reguladores postranscripcionales. Algunas modificaciones de histonas como las que mencionas también son un poco arriesgadas y también puede haber modificaciones bivalentes. Sin embargo, si hay una razón sólida para especular que estas marcas están asociadas con la represión, puede probar estas:

  1. Puedes verificar cuántos genes hay cuya expresión no está de acuerdo con las marcas de histonas. Si se trata de una pequeña cantidad de genes, puede investigarlos por separado. Use una prueba estadística para verificar la importancia de su correlación entre la marca de histonas y la expresión. Si la discordancia es generalizada, le sugiero que repita el RNAseq (más fácil y más barato que repetir el ChIP-seq). Por cierto, ¿cómo fueron las cualidades de lectura? Dependiendo de eso, puede decidir qué experimento necesita repetición. La repetición te ayudará a saber si la observación es realmente correcta (una réplica biológica); posiblemente también puede llegar a la conclusión de que estas marcas son realmente peligrosas.

  2. Si algunos genes muestran discordancia, simplemente realice PCR en tiempo real para estos genes. RT-PCR es más sensible y otra técnica de cuantificación es igualmente buena. Use algunos genes concordantes también en el experimento.

¿De qué prueba estadística estás hablando? Tengo alrededor de 40 genes que no son compatibles con RNAseq, también tengo genes que son compatibles con RNAseq pero no con esas histonas. Sp, tengo el diagrama del rey de Venn del número de genes RNAseq frente a la modificación activa de histonas.
@Tonja 40 genes discordantes: ¿cuántos están de acuerdo con el RNAseq? No estoy seguro de qué prueba estadística usar aquí. Básicamente, debe ver cuál es la probabilidad de que RNAseq no esté de acuerdo con la modificación de histonas.

ChIP-seq no es perfecto. Incluso entre réplicas técnicas, obtiene una buena cantidad de variación, especialmente para marcas anchas como las que está usando. Es bastante raro ver a personas usar H3K79me2 y H3K36me3 para determinar si un gen se expresa o no. El uso de H3K4me3 y H3K27ac o H3ac es un método más común para marcar promotores de genes transcritos.

40 genes discordantes no me preocuparían mucho a menos que realmente tenga lecturas bajas para cualquier conjunto de experimentos de secuenciación. La sugerencia de @WYSIWYG de usar RT-PCR para verificar sus datos de RNA-seq para algunos genes es buena.

También verifiqué las histonas del promotor y también tengo algunos genes que no son compatibles con RNA-seq. Sé que podría validar los resultados, pero eso es codificar datos. Entonces, me gustaría saber la razón teórica de eso.
¿Qué es codificar datos? ¿La secuencia de ARN?
@JaredAndrews Creo que Tonja se refiere a los TFBS ChIP-seqs..
@WYSIWYG Si ese es el caso, sugeriría buscar diferentes marcas, ya que ciertamente las tienen si también tienen H3K79me2 y H3K36me3. El epigenoma es complejo, flexible y variante. Como tal, debe mirar las piezas como un todo siempre que sea posible.