Según tengo entendido, la muestra del genoma humano llamada NA12878 proporciona variantes de alta confianza para una muestra humana. Se está utilizando como punto de referencia para muchos proyectos de investigación genómica.
P: ¿ Por qué exactamente el NA12878 es un conjunto de datos de referencia tan popular? ¿Solo porque tenemos un conjunto de variantes de alta confianza? Pero también podemos obtener algunas variantes de alta confianza del proyecto 1000 Genome. ¿Tiene eso algo que ver con la tecnología de secuenciación? ¿Algo que ver con la muestra en sí? ¿Por qué queremos comparar nuestros experimentos con NA12878?
Entonces, para aclarar a las personas que no están familiarizadas con NA12878, esa es la identificación de muestra para una mujer de Utah en particular. Sus padres son NA12891 y NA12892. En los conjuntos de datos de variación humana, eso es lo que se nos da para identificar individuos, una identificación, sexo y población. Todos los demás datos se eliminan para proteger la privacidad del paciente. Entonces, la pregunta es por qué se eligió a NA12878 (esta mujer de Utah) como paciente de referencia en el análisis genómico...
No sé la respuesta práctica real, pero por lo que deduzco es inercia.
No tengo un historial completo de ella, pero sé algunas cosas que hacen que su genoma sea una buena opción para un punto de referencia. NA12878 es bastante antigua para los genetistas y su ADN está incluido en múltiples proyectos heredados, específicamente HapMap.
Ella tiene una enfermedad genética ( mutación CYP2D6 ) que es probablemente lo que inicialmente incluyó el análisis genético de ella y su familia. Esta es una mejor razón para estudiar este genoma en detalle en lugar de simplemente ser alguien famoso (es decir, Venter).
Ella es mormona de Utah (pequeña población fundadora con amplia información genealógica), tiene 11 hijos (puede hacer análisis de recombinación/herencia). Lo que esto significa es que una comprensión profunda de su genoma tendrá aplicaciones para esta población.
Su línea celular linfoblastoide GM12878 se incluyó como célula de estudio ENCODE de nivel 1. Esto significa que también hay terabytes de datos epignómicos para ella.
Cuando elijo hacer un análisis del genoma humano, NA12878 es la opción obvia debido a la cantidad de datos que ya están disponibles, lo que también significa que habrá más datos disponibles. Por lo tanto, creo que la respuesta es en gran medida la inercia.
También considérelo de esta manera, si está tratando de decir que su canalización o tecnología de secuenciación es mejor que otras, y todos usan NA12878 para comparar su tecnología, entonces es aconsejable usar también NA12878 para que los resultados puedan ser comparables.
cris
pequeñoajedrez
cris
pequeñoajedrez
cris
pequeñoajedrez
terdón
pequeñoajedrez
terdón
cris
aliced
carnero RS
Artem
cris