¿Por qué analizar el transcriptoma en lugar del proteoma?

El análisis del transcriptoma (RNA-Seq, microarrays, qPCR, etc.) es probablemente la tecnología más utilizada para evaluar la expresión génica y los procesos celulares dinámicos. Luego, los resultados se extrapolan (análisis funcionales, GO, etc.) para inferir consecuencias celulares biológicas. Los ARN son realmente solo el intermediario. La presencia de un ARNm no significa necesariamente que se convertirá en una proteína. Podría ser degradado por microARN, etc. antes de la traducción. Eventualmente, es la proteína la que en realidad es la causa de un cambio biológico.

Entonces, mi pregunta es por qué no ir directamente a las proteínas. ¿Por qué no simplemente extraer las proteínas y secuenciarlas, cuantificarlas, analizarlas y sacar conclusiones? ¿Cuáles son los argumentos convincentes para estudiar el transcriptoma para comprender los procesos biológicos?

Otra cosa que no está directamente relacionada con la premisa de su proceso celular, pero que sin embargo es un aspecto positivo de RNA-Seq: también le brinda secuencias de codificación y proteínas a un costo mucho menor que la proteómica o la secuenciación del genoma, por lo que es útil para la filogenética/filogenómica.
@NatWH, un buen punto. También necesitamos bases de datos de secuencias para buscar datos proteómicos basados ​​en espectrometría de masas. En ausencia de datos genómicos, muchos grupos usan datos de RNA-seq para construir esta base de datos de secuencias para que luego puedan usar MS.

Respuestas (5)

P: ¿Por qué no simplemente extraer las proteínas...

R: No es solo una cuestión de extraer las proteínas, tendrías que separarlas y luego aislar cada una de ellas. Actualmente no existe una forma práctica de hacer esto para, digamos, 10.000 proteínas, que en cualquier caso pueden tener múltiples formas. La belleza del método RNAseq es que no requiere la separación física o el aislamiento de las transcripciones.

Un enfoque con más probabilidades de ser útil es identificar y cuantificar las proteínas in situ , pero esto todavía está lejos de tener la exhaustividad y la sensibilidad requeridas.

P: …ordenarlos…

R: La secuenciación de proteínas es lenta y difícil. No se puede aplicar a gran escala, a diferencia de la secuenciación de copias de ADN de transcritos de ARN. Otros métodos de identificación basados ​​en el comportamiento físico (posición de migración o elución) son más prometedores y la dirección que es probable que se siga.

P: …cuantificarlos…

R: Incluso eso es difícil, por ejemplo, cuando eluyes proteínas de geles. Por el contrario, la metodología RNAseq solo cuenta las transcripciones. (Pero la dirección probable en la que esto irá es la cuantificación por la altura del pico, sin separación ni aislamiento, como con la metabolómica, o por la intensidad de alguna señal de la proteína inmovilizada en el gel, tinción de algo más sofisticado).

Por lo tanto, en general, realiza análisis de proteínas en proteínas individuales particulares que le interesen, mientras que puede realizar análisis de RNAseq en todas las transcripciones en una muestra biológica y luego ir a pescar (entre los resultados, y luego en el lago si ese es su cosa).

There are no methods that will separate, say, 10,000 proteinsla electroforesis en gel puede separar fácilmente este número de proteínas. La cromatografía líquida también puede hacerlo. La detección de proteínas intactas es actualmente de bajo rendimiento, pero LC-MS en péptidos puede proporcionar datos cuantitativos para miles de proteínas, la capacidad de detectar PTM es una característica, no un error.
@Michael_A: técnicamente, puede tener razón (o en parte), pero en el contexto de esta pregunta de un miembro ingenuo de la lista, creo que es más probable que su comentario confunda que ilumine. Reescribiré mi respuesta de una manera que aborde su punto sin diluir la explicación. Pero habrá que esperar otro día.
@Michael_A: modifiqué mi respuesta para abordar los puntos que mencionó. En algún momento puedo modificarlo aún más con una consideración de cómo los avances tecnológicos influyen en la ciencia y las referencias al estado actual de la proteómica.

¿Por qué no simplemente extraer las proteínas y secuenciarlas, cuantificarlas, analizarlas y sacar conclusiones?

Porque la proteómica es realmente difícil. Para proporcionar un ejemplo, no existe una proteína equivalente a la PCR . Eso significa que no existe una forma sencilla de seleccionar y amplificar una proteína particular de una mezcla compleja. La invención de la PCR fue fundamental para los rápidos avances en genómica en los últimos 40 años.

La espectrometría de masas es la herramienta principal para la proteómica de alto rendimiento y los análisis de espectrometría de masas siguen siendo muy difíciles de ejecutar y aún más difíciles de interpretar .

Si bien tiene razón en que 'el resultado final' siempre es proteína y que el análisis funcional en el nivel de ARNm puede ignorar las cosas del control de traducción, existen buenas razones para analizar el transcriptoma:

1) Como dijiste, pueden pasar muchas cosas con el ARNm: puede degradarse, traducirse o también reprimirse por un tiempo hasta que se active nuevamente. La mayoría de estos procesos de control tienen un efecto bastante fuerte en la "producción final de proteínas", pero son mucho más fáciles de estudiar en el nivel de ARNm/transcriptoma (ya que ahí es donde ocurren).

2) Analizar el transcriptoma a nivel de todo el genoma es técnicamente relativamente fácil: la tecnología de secuenciación ya está bastante avanzada y hay muchos protocolos diferentes establecidos para observar no solo los niveles de expresión de los ARNm individuales, sino también otras cosas como la estabilidad, el procesamiento (es decir, empalme o poliadenilación) y también traducción de mRNA. Todo esto también se puede hacer con una entrada de material relativamente baja.
El análisis de proteínas, por otro lado, requiere el uso de espectrometría de masas que no es necesariamente tan potente o sensible como la secuenciación.

Creo que es útil tener en cuenta que el transcriptoma consta de transcritos que no codifican proteínas, como miARN, y que, si bien la proteína está regulada en gran medida, el producto final no siempre es proteína. ncbi.nlm.nih.gov/pmc/articles/PMC4177046

What are the compelling arguments to study the transcriptome to understand biological processes?

Existen argumentos convincentes para estudiar el transcriptoma, pero dependen de la pregunta de investigación. La investigación que se centra en la activación de los factores de transcripción debe utilizar datos transcriptómicos, al igual que la investigación sobre eventos de procesamiento de ARN (empalme, procesamiento previo al ARNm, estabilidad). También desea datos de transcripción al estudiar transcripciones de ARN que no codifican proteínas.

No creo que haya argumentos biológicos convincentes para estudiar el transcriptoma cuando se quiere conocer la expresión de los genes que codifican proteínas en tejidos o células. Debe centrarse en las proteínas, ya que son el paso final en la expresión de genes que codifican proteínas. La correspondencia entre los niveles de transcritos que codifican proteínas y su proteína puede ser excelente pero también puede ser muy pobre. Los datos de la transcripción no pueden segregar estos grupos. En estimaciones globales, los niveles de transcripción solo explican alrededor de la mitad de la variación en los niveles de proteína. Creo que ese nivel de inexactitud es inaceptable cuando hay una alternativa viable.

Why not just extract the proteins and quantify them?

Existen limitaciones físicas e históricas para la cuantificación global de proteínas. He recopilado un par de limitaciones que considero más importantes. La espectrometría de masas (MS) es el método actual de elección para la cuantificación de proteínas de alto rendimiento. Los métodos como la secuenciación de Edman o la detección inmunológica tienen un rendimiento mucho menor.

Existen limitaciones físicas que actualmente impiden que la EM realice mediciones globales cuantitativas utilizando proteínas intactas. Eso es muy desafortunado. Actualmente, las mediciones globales se realizan mediante la cuantificación de péptidos a partir de proteínas digeridas utilizando un sistema de cromatografía líquida para alimentar la MS con péptidos (LC-MS). Los péptidos se identifican y luego se asignan a una proteína o grupo de proteínas. Los resultados finales son confiables y la mayoría se resolverá con identificaciones de proteínas individuales. Algunos péptidos solo se resolverán para identificar un grupo de proteínas. Esta es una limitación menor en la mayoría de los casos.

Hacer mediciones globales de las cantidades de proteínas solo ha sido posible en la última década, mientras que las mediciones globales solo se han vuelto rutinarias con el advenimiento de LC de ultra alto rendimiento emparejado con los espectrómetros de masas más nuevos. Muchos investigadores académicos tendrán acceso a esta tecnología a través de sus instalaciones locales de espectrometría de masas, pero la mayoría no se dará cuenta. Esta novedad es en gran parte la razón por la que es menos común.

Summary

Creo que la cuantificación de proteínas mediante LC-MS se utilizará con más frecuencia en lugar de los datos de transcripción en los próximos dos años. Esto se debe a la capacidad de los instrumentos LC-MS actuales de proporcionar mejores respuestas en sistemas biológicos que requieren información sobre el nivel de proteínas. Los revisores comenzarán a exigirlo. Creo que en la próxima década, la LC-MS de alto rendimiento podría volverse lo suficientemente barata como para incluso reemplazar las técnicas inmunológicas de menor rendimiento, como la inmunotransferencia y la inmunofluorescencia.

Hay un aspecto que no se ha detallado: un transcriptoma es mucho más económico que un proteoma . Analizar una sola proteína en LC-MS/MS puede costar tanto como un transcriptoma. Y si perteneces a esos pequeños grupos con fondos insuficientes que trabajan en organismos no modelo que son realmente interesantes pero no realmente útiles para curar el cáncer, entonces no tienes otra opción.