¿Qué significa el número de sonda y la segmentación en los datos de variación del número de copias (CNV)?

En los datos de variación del número de copias (CNV) de TCGA hay una columna con el título Num_Probes. ¿Cuál es el significado del número de sonda con respecto a los datos de muestra a continuación?

Chromosome  Start   End Num_Probes  Segment_Mean
1   61735   62152   4   1.1973
1   62920   12777697    6514    2.2882

Según wikipedia , las sondas suelen tener entre 100 y 1000 bases de largo. Entonces, ¿significa que en la primera fila de arriba se necesitaron 4 sondas para identificar la región (61735 - 62152)? En ese caso, ¿cuál sería el significado de Segment_Mean?

Respuestas (1)

Parece que los datos que publicaste fueron producidos por GISTIC , un programa comúnmente utilizado por TCGA para detectar cambios en el número de copias. Asumiendo que los datos realmente son producidos por GISTIC, entiendo que "Segment_Mean" se refiere a la relación Log2 promedio de las sondas en ese segmento en particular. Parece que el número de copias de su segmento de 4 sondas en su ejemplo es un poco menos de la mitad del número de copias del segmento más largo.

También puede intentar usar GISTIC Google-Group para obtener más información.

Si una muestra tiene una ganancia de CNV en 12792599 - 13278863 con sonda n.º 100 y media de segmentación de 0,4 y si otra muestra también tiene una ganancia de CNV en la misma posición 12792599 - 13278863 con sonda n.º 200 y media de segmentación de 0,5, ¿significa esto la segunda región de CNV? es más importante que la 1ra región CNV? No entiendo la importancia de la segmentación aquí.
Respuesta simplista: media de segmento superior == mayor número de copias. El número de sondas para cada región probablemente no importe. Además, una diferencia de 0,1 entre la media del segmento de cada región probablemente tampoco importe mucho.