Alteraciones de llamadas en los datos del exoma

¿Cuáles son las principales diferencias técnicas entre denominar con precisión las mutaciones puntuales somáticas frente a la variación del número de copias (CNV) en los datos del exoma? Nota al margen: ¿necesitaría otros datos ómicos para inferir con precisión la CNV (los datos del exoma no son suficientes)?

Respuestas (1)

Los datos del exoma se pueden utilizar para determinar tanto las mutaciones puntuales somáticas como las variaciones del número de copias. El elemento limitante para el poder de detección de ambos es el recuento de lecturas (cuántas lecturas por gen).

Datos del exoma: los datos del exoma utilizan una referencia (para un trío, serían los padres; para el cáncer, sería una muestra normal emparejada de sangre o tejido no invasivo) para determinar si un determinado punto está mutado o no. La secuenciación de próxima generación es propensa a errores de secuenciación, por lo que tener un recuento de lectura lo suficientemente alto es esencial para llamar correctamente a una mutación somática. Aun así, los problemas con sitios muy repetitivos pueden dificultar esto.

El uso de datos del exoma para el número de copias está ocurriendo mucho hoy en día. El número de lecturas se usa como un indicador de cuántas copias existen, y el balance de alelos en cualquier gen dado le indica si ha habido pérdida de heterocigosidad. Por supuesto, con los datos del exoma, no se obtienen datos verdaderamente genómicos. Pero hay suficiente cobertura usando el exoma para captar los grandes eventos.

Datos de CNV: el análisis del número de copias ahora se realiza convencionalmente utilizando una matriz SNP (polimorfismo de un solo nucleótido) de alta densidad. Estos están diseñados para ser bialélicos y vienen en dos tipos. Primero están los SNP del número de copias, que están diseñados para brindar la mejor información sobre el número de copias. Luego están los SNP de genotipado, que brindan información sobre la pérdida de heterocigosidad. A menudo, los datos de la matriz SNP son de mayor calidad, pero esto lo determina su plataforma. Las plataformas más nuevas tienen una cobertura extremadamente alta del genoma y pueden permitirle identificar cambios focales.

Estas matrices, según las recomendaciones del fabricante, no están destinadas a ser utilizadas para llamadas de mutaciones somáticas.


En cuanto a las canalizaciones bioinformáticas, puede utilizar herramientas similares para cada una. Por ejemplo, el paquete Aroma en R tiene canalizaciones para datos de matriz Exome y SNP. GISTIC 2.0 de Broad se puede usar para encontrar cambios en el número de copias focales.

Una palabra de precaución: siempre es mejor validar lo que encuentra en una plataforma con otra. Recientemente trabajé en un artículo que usaba tanto la secuenciación de Exome como los datos de la matriz SNP para determinar el número de copias. Usando GISTIC, no hubo picos focales que coincidieran. Las amplias tendencias cromosómicas fueron las mismas, y eso es lo que informó el grupo.

Gracias, muy bien redactado y claro. Como seguimiento, ¿los datos de secuenciación de ARN ayudarían a aclarar parte de la confusión asociada con los datos exómicos altamente repetitivos, potencialmente al comparar datos transcriptómicos normales y tumorales coincidentes? ¿El uso de datos de micromatrices de ADN le ayudaría a inferir también la variación del número de copias?
Los datos de expresión solo le informan sobre los niveles de expresión (transcripción), no necesariamente el número de copia inherente. Sin embargo, hay una relación. Depende de la pregunta científica. Los datos de ARN son datos adicionales MUY útiles, porque le permiten conectar ganancias o pérdidas con cambios en el nivel de transcripción (¡lo que podría decirse que puede ser más interesante desde el punto de vista biológico)!
Tengo entendido que las micromatrices de ADN (como las que se usan en CGH) brindan información sobre el número de copias, pero no información sobre LOH y, por lo tanto, no brindan una imagen completa de lo que está sucediendo. Por ejemplo, puede tener 2 copias, pero ha perdido un alelo parental (y, por lo tanto, duplica el otro alelo parental). Esto no aparecería en CGH, pero sí al usar datos de matriz SNP.
1) Correcto: parece que necesitaría combinar los datos de la micromatriz de ADN con los datos completos del exoma o del genoma para obtener esa conexión. 2) ¡¡Muchas gracias!! ¿Te importaría votar?