Desviación del equilibrio de Hardy Weinberg (HWE)

Tengo un conjunto de 10 genes, cada gen contiene alrededor de 15 SNP. He probado la desviación del equilibrio de Hardy Weinberg (HWE) para todos los SNP. Todos los SNP no se desviaron de HWE, excepto 5 SNP en ABCG8, que tenían p<0,05. He encontrado diferentes factores que pueden afectar el HWE. Mi pregunta: ¿Por qué el resto de los SNP cumplen con el HWE, por qué solo 5 SNP en ABCG8 se desvían en gran medida del HWE?

Tenga cuidado con las afirmaciones basadas en valores de p: un valor de p permite rechazar la hipótesis nula, pero no confirmarla . En otras palabras, cuando pag < 0.05 se puede decir que HWE está roto, sin embargo pag > 0.05 no significa que HWE se mantenga; aún podría estar roto, pero no podemos probarlo.
Discutiría un poco con @Vadim: cuando haces 150 pruebas, esperas que 0.05 150 = 7.5 SNP para ser pag < 0.05 , ya que bajo la hipótesis nula, los valores p de las pruebas independientes se distribuyen uniformemente. Los valores de p son un estándar de evidencia bastante bajo, excepto cuando son muy pequeños. Que los 5 ocurran en un gen puede ser sorprendente, pero, no obstante, diría que "rechazar" la hipótesis nula basada en ella es un poco fuerte, ya que las observaciones aún son bastante consistentes con la hipótesis nula (sin ver datos adicionales).
@MaximilianPress Estaba hablando de una diferencia más básica sobre el valor p y el poder, objetando la afirmación de que el resto de los SNP cumplieron con el HWE . Sin embargo, estoy de acuerdo contigo en que, dada la gran cantidad de pruebas, incluso los cinco SNP con pag < 0.05 no son una prueba de que se viola HWE.
@Vadim bien, eso tiene sentido. Estoy de acuerdo con su punto general sobre los valores p utilizados para confirmar la hipótesis nula, creo que solo estaba preocupado por el otro lado del problema, que no estaba claro. ¡Creo que en realidad abordaste la pregunta de manera bastante directa y precisa! Sugeriría convertirlo en una respuesta, en realidad.

Respuestas (1)

Una prueba de significación (es decir, valor p) nos permite rechazar la hipótesis nula, pero no confirmarla. En otras palabras, cuando pag < 0.05 se puede decir que las condiciones para HWE no se cumplen, sin embargo pag > 0.05 no significa que HWE se cumpla; es posible que aún no se cumplan las condiciones, pero no podemos demostrarlo. Por lo tanto, al hacer afirmaciones como Todos los SNP no se desviaron de HWE y el resto de los SNP cumplieron con el HWE , se puede estar cometiendo un error estadístico de tipo II .

Como señaló correctamente @MaximilianPress, en este caso uno no debería hacer declaraciones sobre los SNP con pag < 0.05 tampoco, debido a la alta posibilidad de falso descubrimiento . De hecho, un valor p nos da la probabilidad de que los datos sean al menos tan extremos como se observó, aunque la hipótesis nula sea verdadera. Dado norte = 150 SNP que uno espera sobre

norte × α = 150 × 0.05 = 7.5
resultados estadísticamente significativos que ocurran por casualidad, incluso si el HWE se mantiene. Es decir, se podría estar cometiendo también el error Tipo I de rechazar la hipótesis nula, cuando es verdadera. Para excluir este error, se necesita usar una prueba más estricta, por ejemplo, la corrección de Bonferroni , es decir, la prueba contra el nivel de significancia norte veces más pequeño que el actual α = 0.05 :
α α norte = 0.05 150 0.0003