¿Cuál es la mejor manera de analizar los aciertos de espectrometría de masas no cuantitativos de un menú desplegable de inmunoprecipitación?

Estoy estudiando una proteína nuclear y quiero obtener una lista de posibles proteínas con las que interactúa. A partir de la fracción nuclear de las células 293T, hice una IP (inmunoprecipitación) para extraer mi proteína y envié todo lo que extraje para un análisis de espectrometría de masas. También hice una IP con un anticuerpo no específico como control. Tengo una lista enorme de aciertos y no estoy seguro de cómo priorizarlos. Puedo eliminar manualmente los resultados que también se produjeron con el anticuerpo no específico, obviamente son solo proteínas pegajosas. Busqué en Pubmed formas de priorizar aciertos de especificaciones de masas no cuantitativos, pero no estoy seguro de si alguno de ellos funcionaría en mi caso. Todos ellos requieren múltiples repeticiones de espectrometría de masas; puedo hacerlo si lo necesito, pero me gustaría tener una forma de ver mis datos iniciales de manera más inteligente.

El título se refiere a datos cuantitativos, pero es probable que su pregunta describa la proteómica de escopeta (donde los péptidos se seleccionan para MS/MS en función de su intensidad), que no es necesariamente cuantitativa. ¿Podría aclarar esto para que la pregunta pueda ser respondida correctamente? Además, es probable que la instalación que ha realizado el análisis ofrezca una consulta básica sobre la interpretación de datos.
@Michael_A se supone que debe ser cuantificado. Pido disculpas por el error tipográfico.

Respuestas (2)

Si están disponibles, hable con las personas que analizaron sus datos. Usar su conocimiento es inteligente.

Asumiré que se han completado dos pasos críticos. Primero que tus resultados hayan sido buscados correctamente. También supondré que las identificaciones de péptidos y proteínas se han filtrado para proporcionar una tasa de descubrimiento falso de 1:100 en cada nivel.

Puede eliminar todas las proteínas que se identificaron en su control de purificación por afinidad. Otra opción es utilizar el depósito de contaminantes para la purificación por afinidad (CRAPome), que proporciona un marco formal para eliminar las proteínas contaminantes. Es un buen recurso si sus datos son compatibles.

Las proteínas restantes son con las que tienes que trabajar, este es el

lista de proteínas potenciales con las que [su proteína] interactúa.

Priorice estas proteínas en función de la biología de su sistema experimental. Si la lista es pequeña, analice la función de cada proteína y evalúe cómo encaja con la biología que está investigando.

Para evaluar los vínculos funcionales potenciales entre las proteínas, puede crear una red in silico . La agrupación de Markov puede resaltar la presencia de grupos de proteínas funcionalmente distintos dentro de una red. String, vinculado arriba, puede hacer esto. Las medidas de centralidad pueden indicar la presencia de proteínas con el potencial de influir en el comportamiento de la red.

Para listas más grandes, también puede evaluar la función de las proteínas en la lista realizando un análisis de enriquecimiento de anotación funcional. Hay muchas otras cosas que podría hacer, pero el objetivo principal es mantener la biología al frente de sus esfuerzos.

Finalmente mencionas que las repeticiones son necesarias. El análisis de los datos requiere mucho tiempo. Si se trata de una ejecución de prueba, verifique que la prueba haya sido exitosa y luego ejecute las réplicas. El tiempo dedicado a analizar datos incompletos se puede dedicar a completar el conjunto de datos o garantizar que se recopilen los datos correctos. Los datos cuantitativos pueden ser muy útiles y, con cuidado, los enfoques de proteómica de escopeta pueden proporcionar datos cuantitativos, pero es necesario consultar a las personas que manejan la máquina cuando se requieren datos cuantitativos.

Puedes buscar las proteínas más abundantes en tu muestra. Aunque, como usted dice, el análisis LC-MS de su IP no fue cuantitativo, aún puede intentar obtener una estimación cuantitativa. Para elaborar, puede usar, por ejemplo, la cobertura de secuencia, no. de PSM para cada proteína, no. de péptidos identificados para una proteína, parte del espectro de identificación, etc., como indicadores de abundancia.

Existe una correlación aproximada entre la abundancia de una proteína y todas estas cantidades. Si una proteína es más abundante, es más probable que tenga una mayor cantidad de péptidos identificados a partir de ella, más no. de PSM asignados, tendría una mayor cobertura de secuencia, etc. Diferentes personas usan diferentes cosas. A menudo he usado el no. de PSM normalizados por la longitud de la proteína como una estimación de la abundancia de esa proteína.

Como mencionaron otros, hable con las personas que analizaron sus datos. Como regla general, primero filtraría mis datos en 1% de FDR al nivel de PSM, luego al nivel de péptido y luego al nivel de proteína. Luego descartaría todas las proteínas que no fueron identificadas por al menos dos péptidos únicos. Luego compararía las proteínas identificadas en la lista de control negativo y eliminaría las identificaciones comunes. Luego ordene la lista restante en no. de PSM para cada proteína. Esto daría una estimación de las proteínas más abundantes en la muestra IP. Para dar un ejemplo, su proteína de cebo (proteína contra la cual hizo la IP) debe ser la proteína más abundante en su muestra. Después de esto, se podría suponer que las proteínas interactúan con su cebo.

Recuerde que esta no es una forma cuantitativa adecuada de medir las interacciones proteína-proteína mediante purificación por afinidad junto con LC-MS. Pero, es un comienzo útil. Siempre usé información preliminar de tal análisis para diseñar mejores. Además, lea sobre IP recíprocas para confirmar interacciones.