¿Cuál es el tamaño mínimo de población al que se pueden aplicar los cálculos de Hardy-Weinberg?

Estoy tratando de averiguar si un alelo en particular está en desequilibrio de Hardy-Weinberg, pero los datos son deficientes. ¿Cuál es el número mínimo de población que puede usar para obtener algún tipo de conclusión respetable?

Escuché que es un mínimo de 5 individuos para cada genotipo, pero no puedo encontrar una fuente al respecto.

Respuestas (1)

Puede usar el análisis de potencia para obtener respuestas según las especificaciones de sus datos. Las cosas que debes considerar son:

  1. El poder de la prueba . Esta es la probabilidad de que la prueba no rechace la hipótesis nula incluso si en verdad es falsa (error tipo II). Si la población no está en equilibrio, ¿cuál es la probabilidad de que la prueba no lo detecte? Esto dependerá en gran medida de los costes de un error de tipo II. Si el experimento es costoso en términos de tiempo/dinero/animales utilizados, etc. querrá asegurarse de que dará una respuesta satisfactoria al final.
  2. El nivel de significación . 0.05 se usa comúnmente. La probabilidad de que se rechace la hipótesis nula aunque sea verdadera (error tipo I). Si la población está en equilibrio, ¿cuál es la probabilidad de que la prueba diga erróneamente que está en desequilibrio?
  3. Los grados de libertad . El número de alelos.
  4. El tamaño del efecto . Esto es lo lejos que espera que estén sus muestras del equilibrio. El tamaño del efecto más grande sería la extinción de un alelo. Sin embargo, si dos alelos están en una proporción de 100:101 en toda la población, el tamaño del efecto es pequeño.

Para la prueba Chi-cuadrado de Pearson podemos usar (en R)

library(pwr)
pwr.chisq.test(w = 0.3, N = 40, df = 4, sig.level = 0.05 ) 

Una guía aproximada para el tamaño del efecto ( w) es 0,1, 0,3 y 0,5 para tamaños de efecto pequeños, medianos y grandes. Hay más detalles aquí . Nes el número total de puntos de datos, dfes el número de alelos. Esta función nos dará un valor de 1 menos la potencia de nuestra prueba. Un valor de 0,9 significa que hay un 10 % de probabilidad de no detectar un efecto que realmente existe.

Si queremos calcular un número adecuado de puntos de datos para recopilar, debemos decidir qué potencia queremos. Digamos que decidimos que una probabilidad de 0.01 de hacer la prueba, pero no detectar el desequilibrio, si existe, es aceptable.

pwr.chisq.test(w = 0.3, df = 4, sig.level = 0.05, power=0.99 ) 

nos dice que se necesitan 280 puntos de datos.

Sin estimaciones del tamaño del efecto o una cantidad de genotipos, es difícil dar una respuesta directa a su pregunta, pero 5 por genotipo parece muy pequeño.

Si solo tiene dos genotipos, puede optar por usar la prueba exacta de Fisher, en cuyo caso puede usarla power.fisher.test()en el statmodpaquete. Las definiciones de tamaño del efecto y grados de libertad son ligeramente diferentes pero la idea es la misma.

+1: es bueno ver que el análisis de poder se menciona de vez en cuando ... con demasiada frecuencia, los biólogos tienden a omitir estas cosas.
Gracias, aunque pregunté esto hace mucho tiempo y ahora no es muy relevante para mí, ¡estoy seguro de que esto ayudará a las personas en el futuro!
Sí, sabía que era viejo. Pero como dices, ojalá sea útil para los demás. Habiendo obtenido información de stackexchange un millón de veces pero sin haber hecho nunca una pregunta, sé que es potencialmente cierto.