Faltan datos de expresión génica de TCGA con coincidencia normal

Estoy tratando de usar el portal de datos TCGA para obtener datos de expresión génica para tejidos cancerosos, pero no estoy seguro de qué significa "Tumor coincidente con lo normal".

No me queda claro si los valores ya se compararon con un tejido de control (no canceroso) o si hay otra muestra que proporciona valores de tejido sano. Suponiendo que sea lo último, no veo estas muestras en ninguna parte.

Esta es una captura de pantalla de mi filtro.

http://www.clipular.com/c/5452873408184320.png?k=rlA9jy3Kb2U47JT7GrXBTzdsln4

Y aquí hay una foto del resultado (solo aparecen TN).

Solo aparecen TN

Respuestas (2)

Estos valores aún no están normalizados para los controles de tejidos normales. Que un tumor se marque como tumor con normal coincidente no significa que todas las plataformas utilizadas por TCGA (Expresión, CNV, proteína y metilación) tengan tejidos normales disponibles; en la mayoría de los casos, los tumores con normales coincidentes se anotan así porque la mutación llama se realizó usando comparaciones de tumor vs normal.

Si está buscando controles de tejido normal para su tipo de plataforma (RPPA en su captura de pantalla), los encontrará etiquetados como NT o N. Si no ve ninguno etiquetado con esas descripciones, significa que no se han procesado muestras de tejido normal. utilizando esa plataforma.

El TCGA no realiza un montón de análisis de tejido normal para nada más que llamadas de mutación porque el proyecto se centra en clasificar los tumores en subgrupos utilizando enfoques no supervisados, principalmente, y por lo tanto, todas las comparaciones que se utilizan mucho son tumor frente a tumor después de la asignación a subtipos.

El Proyecto TCGA ha estado recolectando tumores primarios y normales coincidentes por paciente por indicación de cáncer y ha estado perfilando exoma (WXS) esas muestras y genoma (WGS) perfilando un subconjunto de ellas. En esos casos, el tumor primario es tejido recolectado del tumor primario y el normal compatible suele ser una muestra de sangre, pero podría derivarse de un hisopo bucal o de alguna otra fuente. Como puede imaginar, tendría menos sentido en términos de expresión ensayar un control emparejado que se deriva de otro tipo de tejido, como la sangre.

Para los datos de expresión, la mayoría de los datos provienen de RNA-Seq y perfiles basados ​​en matrices de los datos del tumor primario, y en algunos casos en los que se recolectó y envió tejido normal adyacente, la TCGA también ha perfilado esas muestras. Esto es probablemente lo que está viendo con su filtro TN y, en general, por qué tiene problemas para encontrar cantidades equivalentes de normales coincidentes en comparación con las muestras de tumor primario para los proyectos de expresión.

Por cierto, la empresa para la que trabajo ha lanzado recientemente un portal gratuito de datos genómicos para la comunidad de investigación llamado GeenPool Reference. Como parte de esto, hemos depositado todos los TCGA RNA-Seq disponibles públicamente. Los datos junto con todos los metadatos clínicos asociados están fácilmente disponibles para navegar y extraer datos. Podrá calcular fácilmente la cantidad de muestras y sus pares coincidentes. Si está interesado, puede echar un vistazo a los proyectos de datos disponibles en GenePool Reference aquí: http://www.stationxinc.com/reference-library

~Sandeep