¿Cómo se estima la expresión génica?

Estoy leyendo este fantástico artículo sobre la estimación del tiempo corporal: Métodos de calendario molecular para la detección de trastornos del ritmo y el tiempo corporal a partir de perfiles de expresión de todo el genoma en un solo punto de tiempo y una de las cosas que no me queda muy clara es cómo los investigadores estimaron qué genes se expresan y cuáles no:

El ARN total se preparó utilizando el reactivo Trizol (GIBCO ??BRL). Las reacciones de síntesis de cDNA y marcaje de cRNA se realizaron como se describe (5). Se hibridaron, tiñeron y lavaron matrices de oligonucleótidos de alta densidad de Affymetrix (Murine Genome Array U74A, versión 1.0, que mide 9977 transcritos independientes) de acuerdo con el Manual técnico (Affymetrix). Se usó el software Affymetrix para determinar la diferencia promedio (AD) entre las sondas perfectamente coincidentes y las sondas de un solo par de bases no coincidentes. A continuación, la AD de cada sonda se escaló globalmente para que la AD total de cada micromatriz fuera igual. Los valores de AD resultantes reflejan la abundancia de un ARNm dado en relación con la población total de ARN y se utilizaron en todos los análisis posteriores.

No estoy seguro de estar leyendo esto correctamente: ¿observaron los investigadores todo el ARN disponible en las células y calcularon los niveles de ARN mensajero producidos por los genes expresados? si no, ¿cómo se puede estimar el nivel de expresión de un gen?

Respuestas (2)

La técnica descrita aquí se llama microarreglo. Su pregunta me ha dado la oportunidad de exponer una de mis opiniones sobre ciertos problemas de los estudios de expresión génica.

La expresión génica es una medida de la actividad de cualquier gen. Si el gen realiza su actividad en forma de proteína, entonces su expresión debería ser una medida de la proteína. Si un gen produce un ARN no codificante, su expresión es una medida de la concentración de ARN.

[Puede omitir los casos de modificación postraduccional debido a la transducción de señales. Se expresan mucho y se usan de forma transitoria pero frecuente. ]

Al igual que su ejemplo, hay muchos estudios que utilizan la concentración de ARNm como indicador de la actividad de la proteína. Este proxy funciona en muchos casos porque la regulación génica transcripcional es un mecanismo que se usa con más frecuencia para impartir cambios estables. Pero la mejor estrategia siempre sería medir también las proteínas.

Además del microarray, existen varias técnicas para medir la concentración de ARN:

  • Secuenciación de ARN (alto rendimiento)
  • PCR en tiempo real (rendimiento medio)
  • Northern Blot (Bajo rendimiento, semicuantitativo)

Existen muchas técnicas para medir proteínas también:

  • Espectrometría de masas (alto rendimiento)
  • ELISA (Bajo rendimiento, cuantitativo)
  • Western blotting (Bajo rendimiento, semicuantitativo)

Por lo general, se usa el "método proxy" porque la cuantificación de proteínas es comparativamente más difícil. Las técnicas basadas en anticuerpos como ELISA y Western Blot tienen problemas de comparación cruzada de proteínas debido a la variabilidad de la eficiencia de unión de anticuerpos.

cuando desea concentrarse en un solo gen, qPCR debería funcionar mejor. Los microarrays son los mejores para la evaluación del transcriptoma total.
sí... uno o número contable de genes...
Desafortunadamente, no recuerdo los detalles, pero recientemente vi una charla en una conferencia donde se demostró que los niveles de ARNm en realidad no se correlacionan con los niveles de proteína. Quiero decir, siempre hemos sabido esto, pero los números mostrados fueron impactantes (menos del 50%, tal vez tan bajo como 30). Intentaré obtener una referencia y publicaré de nuevo.
Guau, acabo de encontrar un artículo de 1998 que dice que en la levadura "Descubrimos que la correlación entre el ARNm y los niveles de proteína era insuficiente para predecir los niveles de expresión de proteína a partir de datos cuantitativos de ARNm". Y, sin embargo, aquí estamos, todavía usando esos datos...
@terdon Varía según el caso, en muchos casos hay una relación, pero es difícil decirlo a priori. Esto es difícil si tiene una gran cantidad de conjuntos de sondas de interés. Como regla general, los paneles de qPCR suben a un par de decenas de genes y luego se vuelven difíciles.
@shigeta Lo sé, solo tengo este gráfico de la conferencia que mencioné en mi cabeza (no puedo encontrarlo) donde se hizo un análisis del nivel del transcriptoma y la correlación fue patética. Lo encontraré en alguna parte, fue una reunión clave en Heidelberg, no puede ser tan difícil de encontrar.
Tengo entendido que los científicos a menudo usan estos experimentos de micromatrices como métodos de detección de alto rendimiento para identificar genes candidatos o redes de genes. Si realmente se puede confiar en los datos de uno de estos experimentos, siempre se debe realizar un seguimiento mediante métodos bioquímicos tradicionales (espectrómetro de masas, transferencia Western, ELISA/RIA, microscopía).
@terdon... no siempre es necesario, pero hay varias evidencias de que los niveles de proteína no se correlacionan con los niveles de ARNm...
@leonardo: oye, la especificación de masas no es tan tradicional :P
@terdon también he visto otros gráficos, uno notable habría sido un gráfico con muchos puntos en la clase de George Church en HMS que vi una vez. Dado el estado de las cosas, sería útil una referencia y una lectura del trabajo. Mi recuerdo fue que la correlación fue especialmente en concentraciones bajas de ARNm y que la pendiente general fue de 3 para humanos. La correlación general no fue excelente, pero tampoco fue 0. Como siempre, cualquiera que espere una regla sólida en biología para tales cosas parece estar decepcionado...
Ok, encontré y escribí parte de la información sobre mi ida y vuelta con @terdon. Espero que algunos lo encuentren relevante.
@WYSIWYG: no, supongo que no, pero ciertamente es cuantitativo y altamente sensible, por lo que (perezosamente) lo estoy agregando a los métodos más tradicionales. ;)
@leonardo: tiene mucha razón, hoy en día que la moda de los microarrays se ha ido, no muchas revistas aceptarían un estudio que muestre SÓLO datos de microarrays, sin ninguna validación adicional. Por supuesto, la solución es saltar a la moda actual, RNAseq :D
@leonardo: ¿Puedes aclarar qué quieres decir con que la EM es muy sensible? Tengo entendido que un problema con la EM es que solo obtiene lecturas confiables (cualquiera) para las proteínas más abundantes en su muestra, ¿no?
@SteveLianoglou: MS no es mi experiencia, pero eso no lo entiendo (esto puede variar según el tipo de MS utilizado, por ejemplo, TOF-SIM, GC). La identificación exitosa de proteínas a través de MS depende de la abundancia pero también de la longitud del fragmento peptídico (léase: optimización experimental). En teoría, la MS puede bajar a una resolución de 1 fmol. Consulte esto para obtener más información: lab.rockefeller.edu/chait/pdf/08/08_eriksson_wiley.pdf
@SteveLianoglou: Según tengo entendido, MS es sensible en el sentido de que puede detectar cantidades diminutas, pero el gran problema es la interpretación de los datos.

Información complementaria de los Comentarios de la primera respuesta:

¿Quizás he encontrado la referencia de @terdon? No estoy seguro de si es así, pero al medir los eventos de transcripción en células individuales, Taniguchi et al. ciertamente argumenta que no existe una correlación entre los niveles de proteína y ARNm.

Sin embargo, los datos de micromatrices (y la mayoría de los experimentos de rnaSeq y qPCR) son mediciones de conjunto; miden la concentración promedio de ARNm en una muestra de millones de células. En conjunto, el documento también dice que, en conjunto , el ARNm promedio se correlaciona con la concentración promedio de producto proteico . Vea este bonito artículo en el blog de OmeSpeak .

En general, lo que sucede microscópicamente: la traducción es un proceso algo estocástico en la celda individual y los eventos deben modelarse explícitamente. La biología en conjunto (caso promedio en una población celular) es a menudo con lo que tenemos que trabajar; Las técnicas unicelulares son bastante arduas. (ejecutar un gel de proteína en una sola célula!). Creo que hay espacio para ambos tipos de información cuando se investiga biología; ciertamente, la publicación de trabajos medidos en más de una celda a la vez continuará durante algún tiempo.

Todo el trabajo citado aquí está en E coli, pero en eucariotas se supone que esto no va a ser más sencillo.

el ruido de la expresión génica también es una característica variable... en algunas redes de genes, el ruido es bajo mientras que en otras es alto...