Una pregunta sobre la exclusión de los participantes del estudio para una matriz de genotipificación Exome

Estoy leyendo un artículo que usó la secuenciación del exoma completo en poblaciones afroamericanas y europeas para descubrir nuevas variantes raras y de baja frecuencia asociadas con los niveles de lípidos y el riesgo de enfermedad coronaria.

Utilizaron la matriz de genotipificación del exoma humano de Illumina que se diseñó en función de las variantes de codificación descubiertas al secuenciar los exomas de 12,000 individuos. Por lo tanto, seleccionaron a sus participantes de un estudio que no se encontraban entre las 12 000 personas utilizadas para diseñar la matriz.

Mi pregunta es: ¿Por qué seleccionaron individuos que no estaban entre los 12,000 que se usaron para diseñar la matriz? (Estoy pensando porque tal vez podría producir asociaciones de falsos positivos? ¿sesgo?)

¿Puede agregar una cita para este artículo?
@Chris, la fuente es del artículo Asociación de variantes de secuencia de codificación raras y de baja frecuencia con lípidos en sangre y enfermedad coronaria en 56,000 blancos y negros. ncbi.nlm.nih.gov/pubmed/…
Le echaré un vistazo mañana y he añadido el enlace a tu publicación.

Respuestas (1)

Cuando diseña las matrices, necesita tener sondas en la superficie complementarias a la secuencia que desea detectar. Dependiendo de lo que desee detectar, debe diseñar estas sondas con una secuencia conocida en una posición conocida. Si desea detectar polimorfismos de un solo nucleótido (SNP), necesita una biblioteca de SNP conocidos en su ChIP, que son básicamente la posición del SNP y la secuencia circundante.

Los SNP se pueden agrupar aproximadamente en dos subgrupos, comunes (los llamo así) y raros (frecuencia en la población inferior al 0,1%). El problema con este método basado en ChIP es que solo puede detectar SNP que ya se conocen (o al menos están ubicados cerca de SNP conocidos con los que están en desequilibrio de enlace). Entonces, si desea detectar SNP raros en su muestra de población, necesita un gran grupo de personas de las cuales tome los SNP en su diseño de ChIP. Si observa los números, una variante rara solo estará presente en aproximadamente 12 de las 12,000 personas utilizadas en el diseño.

Entonces, su grupo de estudio es diferente del grupo de personas que se usó para hacer el diseño de ChIP. Aquí tomas personas con ciertos antecedentes (niveles altos de lípidos, por ejemplo) y luego comparas, si las personas que tenían problemas cardíacos coronarios tienen SNP en común que podrían estar relacionados con esta enfermedad. Esto puede ayudar a identificar una mutación en una proteína que es el factor de riesgo.