Cuantificación de la expresión génica

Descubrí que muchos estudios usan la concentración de ARNm como un "representante" de la actividad de la proteína porque debería haber una correlación entre los niveles de ARNm y los niveles de expresión de las proteínas. ¿Cómo se cuantifica la actividad de las proteínas? ¿Qué cantidad se utiliza? ¿Qué son los niveles de expresión de proteínas?

Estoy haciendo un análisis de datos estadísticos utilizando este conjunto de datos . Me gustaría entender por qué se han interesado en medir la concentración de ARNm después de la radiación gamma de las células (y en general me parece que los biólogos en muchos experimentos están interesados ​​en eso). Encontré en este sitio esa discusión sobre la correlación entre la concentración de ARNm (por lo tanto, el nivel de expresión génica) y el "nivel de expresión de proteínas". Por lo tanto, quería saber qué es esto último. Además, en el artículo relacionado con mi conjunto de datos está escrito

Muy pocos genes de reparación del ADN mostraron una expresión diferencial significativa en P. furiosus después de la irradiación gamma.

Y luego

los datos que informamos aquí sugieren que las proteínas de reparación del ADN en P. furiosus y varias otras arqueas se expresan constitutivamente y que pueden estar presentes en la célula a un nivel suficiente para mantener la integridad del material genético de la célula.

Entonces, juntando lo que los científicos concluyen con lo que MattDMo me ha respondido y lo que se discute aquí , creo que puedo concluir que el "nivel de expresión de proteína" es una medida de la cantidad de proteína realmente traducida del ARNm, que luego (en este caso) actuará efectivamente para reparar el ADN. Por lo tanto, "nivel de expresión de proteína", así como "actividad de proteína", indica las proteínas traducidas del ARNm y que actuarán activamente para reparar daños en el ADN (en este caso, estamos hablando de proteínas de reparación de ADN y genes de reparación de ADN).

Debo decir que no sé muy bien qué significa "las proteínas reparadoras del ADN se expresan constitutivamente", pero creo que es que las proteínas reparadoras del ADN ya han sido traducidas del ARNm y por lo tanto están "presentes en la célula a un nivel suficiente para mantener la integridad del material genético de la célula" (como se dice poco después).

Todo esto tiene sentido para mí si pienso en mi primer objetivo que era entender el motivo de medir la concentración de ARNm. Nos interesa porque debería haber una correlación entre la concentración de ARNm (nivel de expresión génica) y las proteínas realmente traducidas del ARNm de ese gen específico, para saber qué tipo de proteínas actuarán efectivamente en los procesos de reparación del ADN (en este caso ).

Me pregunto si toda esta interpretación es correcta...

He eliminado mis comentarios ya que ahora están incorporados en una respuesta. He cambiado su título para que sea más general y por razones que hago evidente en mi respuesta.
Ahora he agregado una posdata que aborda las circunstancias específicas de su trabajo, que son de menor interés general que el tema principal de mi respuesta. (Las buenas preguntas sobre las respuestas en Stack Exchange deben ser de interés general, no un diálogo con el cartel). En resumen, "toda esta interpretación" no es correcta. Además, la medición de la concentración de ARNm se realiza porque refleja el grado en que un gen se expresa como ARNm. El tema de interés es la expresión génica, de la cual la cantidad de proteína producida es solo una parte. Y el término "actividad de la proteína" no tiene sentido y no debe usarse.

Respuestas (1)

¿Qué es el nivel de expresión de proteínas?

Este era el título original de la publicación, que edité yo mismo porque considero que la respuesta es trivial, pero la pregunta es más sustancial. Para tratar con lo trivial primero:

'Nivel' no es una unidad científica, y solo puede usarse sin ambigüedades como un término científico en su sentido inglés en relación con líquidos, por ejemplo, "El nivel de mercurio en el termómetro había bajado", "La tierra está a 10 metros sobre el nivel del mar". nivel."

Algunas personas lo utilizan en el habla o la escritura informales para indicar una cuantificación indefinida y, debido a su ambigüedad, debe desaconsejarse enfáticamente en la comunicación científica.

Así que ni yo ni nadie más puede decir qué es el 'nivel de expresión de proteína' sin averiguar qué pretendía el autor de la frase (si es que lo sabía) en cualquier instancia individual: cantidad o concentración de proteína, o la velocidad de su síntesis.

cuantificación

Consideremos algunos aspectos generales de una molécula celular que pueden requerir cuantificación : cantidad, tasa de síntesis, tasa de degradación y, cuando corresponda, actividad biológica.

La cuantificación de moléculas en su forma más básica es el número de especies o, más prácticamente, su masa total (gramos), en lo posible relacionada con su masa molecular (es decir, moles). La velocidad de su síntesis o degradación se expresa en términos del cambio de su cantidad en la unidad de tiempo.

Para comparar diferentes sistemas se necesita una referencia para la cuantificación. Esto puede ser por unidad de volumen, por célula, por g de proteína celular, por g de ADN, etc. (Sin embargo, para la comparación de sistemas similares o dentro de un sistema, a menudo se omite la referencia).

La actividad biológica de las moléculas sólo tiene significado si las moléculas son, de hecho, biológicamente activas (por ejemplo, enzimas). Se expresa en unidades relacionadas con esa actividad.

Ejemplos de cuantificación de proteínas

Las unidades reales utilizadas en la cuantificación están determinadas por cómo se puede medir el parámetro de interés.

Cantidad relativa de proteína: puede detectar una proteína por la intensidad de la tinción de una banda en un gel o por el grado de precipitación con el anticuerpo correspondiente. Estos tendrían que ser calibrados contra estándares para convertir medidas experimentales crudas a g o mol de proteína. Las unidades típicas de cantidad relativa son g/g de proteína total, g/g de ADN.

Tasa de síntesis o degradación de proteínas. Puede detectar la síntesis de proteínas por la tasa de incorporación de aminoácidos radiactivos en proteínas no radiactivas y la tasa de degradación por la liberación de aminoácidos radiactivos de proteínas premarcadas. Las unidades típicas de síntesis serían mg de aminoácidos incorporados por minuto por mg de proteína total. (Esto se puede convertir en moléculas sintetizadas o degradadas por minuto, si es necesario).

'Actividad Proteica' : No se recomienda el uso de este término . En términos químicos, la actividad de una molécula es una medida de su "concentración efectiva" , y en relación con las proteínas sería solo preocupación de biofísicos y similares. Otros biólogos asociarían el término con la actividad biológica que podría tener una proteína como una enzima, pero como muchas proteínas son estructurales, el término "actividad" no se puede aplicar a las proteínas en general. Cuando sea de interés, se cuantificará en términos de la naturaleza de la actividad, por ejemplo, una enzima se cuantifica en unidades relacionadas con la cantidad de sustrato convertido en producto en un tiempo determinado.

La expresion genica

Cuantificación de la expresión génica mediante micromatrices de oligonucleótidos

Los dos extremos en la cuantificación de la expresión génica son el estudio detallado de la expresión de un gen particular que codifica una proteína para la cual se dispone de información y herramientas; y estudio general de la expresión de muchos genes utilizando métodos modernos que permiten el estudio de muchas moléculas simultáneamente. Dichos métodos incluían espectrometría de masas (para metabolitos pequeños), electroforesis en gel bidimensional (para proteínas) y micromatrices o RNAseq (para ARNm). En general, en el último caso se examinaría el efecto de algún agente o condición en todo el espectro de la expresión génica.

Examinemos la tecnología de microarrays , ya que esa es la principal preocupación del póster.

La tecnología de micromatrices mide las cantidades relativas de ARNm.

La metodología consiste en amplificar una mezcla de especies de ARNm mediante transcripción inversa a ADNc, que se marcan con un tinte fluorescente. El ADNc se hibrida con oligonucleótidos inmovilizados en función de las secuencias de los genes en el organismo, y se supone que la intensidad de la señal de fluorescencia es proporcional a la cantidad de especies de ARNm individuales en la muestra. Sin embargo, los datos proporcionados al usuario son la intensidad relativa de la imagen dentro del experimento, en lugar de las unidades que permiten calcular la cantidad real de ARNm.

¿Cómo se relacionan estas cantidades relativas de ARNm con la expresión génica?

  1. Las cantidades relativas de mRNA son una medida relativa de la tasa de síntesis de proteínas (3 en dig.), si se asume que la tasa de síntesis de cada proteína es similarmente proporcional a la cantidad de su mRNA (a en dig.) que sería limitante. Esta es una suposición razonable en la mayoría de los casos dado que el ARNm se degrada más rápidamente que la proteína. (No son una medida de la cantidad de proteína — b en dig.)

  2. Las cantidades relativas de ARNm no pueden tomarse como una medida de la tasa de transcripción de un ARNm de su gen (1 en dig.) debido al efecto relativamente mayor de la degradación del ARNm (2 en dig.) en la concentración de ARNm en estado estacionario. , y el hecho de que diferentes ARNm tienen diferentes vidas medias.

Posdata para el cartel

He tratado de hacer que esta respuesta sea general, para que sea útil para más personas. Como la persona que publica la publicación no es bióloga, aún puede tener dificultades para comprender los antecedentes de los experimentos biológicos que generaron los datos que está analizando.

El sistema biológico de interés es la expresión génica, que abarca toda la serie de eventos desde la transcripción de genes hasta el ARNm y su traducción a proteínas. El trasfondo de esto es que hay algunos genes que (casi) siempre se expresan, independientemente de las circunstancias fisiológicas, porque son necesarios para mantener la estructura y las funciones cotidianas de la célula. Esto se denomina expresión constitutiva , siendo ejemplos la expresión de genes para actinas del citoesqueleto o proteínas ribosómicas. Otros genes se expresan ("activan") solo cuando es necesario (y pueden denominarse genes inducibles ).). La pregunta aquí parecería ser si los genes de las enzimas involucradas en la reparación del ADN se expresan todo el tiempo (constitutivamente) para lidiar con el "desgaste" normal del ADN, o si su expresión solo ocurre en respuesta a algún insulto conocido. dañar el ADN, como la radiación gamma.

Como mencioné, como científico experimental, un enfoque que se puede adoptar aquí es observar la expresión de una o dos proteínas bien caracterizadas que se sabe que están involucradas en la reparación del ADN. Sin embargo, puede haber proteínas involucradas en este proceso que usted desconozca, por lo que los métodos modernos para observar la expresión de todos los genes en un organismo (si se conoce la secuencia de ADN): microarreglos de oligonucleótidos o, mejor, RNASeq. Estos métodos miden cantidades relativas de ARNm en una célula. Esto no es un indicador de la cantidad de proteína o la tasa de su síntesis (el término "actividad de la proteína" no tiene sentido y no se debe usar), es lo que es , pero también es un reflejo de la expresión de los genes.que codifican los ARNm. Sin expresión, sin ARNm.

Puede pensar en los enfoques de microarrays y RNASeq como expediciones de pesca. Si encuentra ARNm que solo están presentes después de que la célula recibe un estímulo o una agresión, se ha producido la expresión del ARNm (ya sea que las cantidades sean o no directamente proporcionales a la tasa de síntesis). Si se sintetiza el ARNm, puede suponer que se traduce en la proteína que codifica. En el caso de la radiación gamma, puede suponer que cualquier ARNm que muestre un gran aumento en la cantidad codifica una proteína que interviene en la protección de la célula contra la radiación. Esto será de interés científico, especialmente si no es lo que uno esperaba.

Tengo una duda sobre las cantidades relativas de ARNm: son de alguna manera la relación log10 entre la muestra irradiada y la muestra de referencia. Entonces, si la proporción es 0, no debería haber cambios en la expresión génica (porque es log10(1)=0 ); si es mayor que 0, significa que la expresión génica (cantidad de ARNm) aumenta después de la irradiación (regulación positiva); finalmente, si es inferior a 0, significa que la producción de ARNm disminuye (gen regulado a la baja)?
Esto es lo que he deducido leyendo la explicación de Wikipedia (indicada por ti) y los comentarios sobre RadA en la fig1a del artículo . Creo que si he entendido bien este caso con muestras no irradiadas e irradiadas, puedo extender este razonamiento a otros casos como cultivos de células sanas y no sanas.