Comparación válida de la expresión génica entre varios genes en varias líneas celulares

Tenemos datos de expresión génica (resultados de expresión génica de ARNm de Affimetrix) para varias líneas celulares, sobre un conjunto de genes. Nuestro objetivo sería poder comparar la expresión génica relativa de los genes en las diferentes líneas celulares.

El método en el que hemos pensado hasta ahora implica calcular algún tipo de promedio basado en genes (la expresión de un gen en particular en todas las líneas) y normalizar nuestros datos de expresión, agrupados por gen, en función de eso. Sin embargo, no estamos seguros de que este sea un método válido para obtener datos de expresión relativa de nuestro conjunto de datos, especialmente para que podamos comparar los datos de varias líneas.

¿Parece una estrategia válida? ¿Cómo se hace comúnmente esta normalización? ¿Deberíamos hacer algo diferente para obtener una mejor comparación?

¡Muchas gracias!

Tal vez sería aplicable una prueba estadística formal como ANOVA.

Respuestas (2)

Esta no es una tarea fácil, ya que hay muchos factores que hay que tener en cuenta. En primer lugar, existen diferencias dentro del ensayo como condiciones ligeramente diferentes para cada conjunto de sondas para las repeticiones. Luego, hay diferencias entre ensayos, como diferencias en los portaobjetos de matriz, etc., este documento (" Análisis de datos de expresión génica de micromatrices ") entra en más detalles.

Estos artículos también pueden ser útiles:

Lo que también podrías hacer es revisar el Researchgate , creo que hay más personas con mucha experiencia en este campo.

Muchas gracias. ¡Estos son todos buenos consejos! Revisaré los artículos y probablemente me dirigiré a Researchgate.

Si sus datos provienen de un solo laboratorio y un protocolo estándar, la normalización gcrma es un buen método para usar (y viene con el paquete affy R); si las matrices son del tipo U133A o HGU133plus2, la RMA congelada puede ser un buen método para usar. Finalmente, puede verificar y controlar los efectos por lotes usando ComBat y usar los datos de expresión corregidos.