H es el conjunto de todos los Diplotipos posibles que son consistentes con los datos del genotipo

Soy nuevo en Biology.SX. Tengo experiencia en estadística y casi cero conocimientos en genética. Estoy tratando de entender algunas cosas relacionadas con la genética en cierto artículo de bioestadística.

  1. Los datos de haplotipos se simularon utilizando los patrones y frecuencias de haplotipos (que se muestran a continuación) para 5-SNP a lo largo de una región de susceptibilidad a dabetes en el cromosoma 22, informados en el estudio FUSION.

ingrese la descripción de la imagen aquí

Sé que los haplotipos se pueden representar como secuencias binarias. Me pregunto por qué todo lo posible 2 5 no están presentes aquí. (?)

El papel también dice que

  1. Dejar GRAMO = ( gramo 1 , , gramo METRO ) denote los datos de genotipo sin fase para el METRO lugares H GRAMO denota el conjunto de todos los diplotipos posibles que son consistentes con los datos del genotipo GRAMO .

Si un sujeto porta como máximo una copia del haplotipo causal '01100', pertenece al modelo genético dominante, si porta dos copias de este haplotipo, pertenece al modelo recesivo.

El conjunto H GRAMO no me queda claro Al calcular la probabilidad, necesito saber H GRAMO . ¿Alguna ayuda o sugerencia?

Respuestas (1)

Descargo de responsabilidad: al igual que el OP, sé muy poco sobre genética y supongo que otras personas en el sitio pueden dar mejores respuestas que yo. De todos modos, dado que la pregunta ha estado sin respuesta durante meses, publicaré mi respuesta. Ojalá alguien lo mejore.

Solo tenga en cuenta que "posible" en este contexto no significa todos los haplotipos que podamos imaginar. Como dice el papel, " H GRAMO denota el conjunto de todos los diplotipos posibles que son consistentes con los datos del genotipo GRAMO y esa es una restricción adicional que permite solo algunos diplotipos: los siete enumerados, no los 32 que podemos imaginar.

Además, tenga en cuenta que la suma de frecuencias en la tabla es igual a 1, por lo que no puede haber más haplotipos en el conjunto.

Sin embargo, ayudaría si vinculara la fuente donde obtuvo esos datos y citas.