Estoy tratando de averiguar si un alelo en particular está en desequilibrio de Hardy-Weinberg, pero los datos son deficientes. ¿Cuál es el número mínimo de población que puede usar para obtener algún tipo de conclusión respetable?
Escuché que es un mínimo de 5 individuos para cada genotipo, pero no puedo encontrar una fuente al respecto.
Puede usar el análisis de potencia para obtener respuestas según las especificaciones de sus datos. Las cosas que debes considerar son:
Para la prueba Chi-cuadrado de Pearson podemos usar (en R)
library(pwr)
pwr.chisq.test(w = 0.3, N = 40, df = 4, sig.level = 0.05 )
Una guía aproximada para el tamaño del efecto ( w
) es 0,1, 0,3 y 0,5 para tamaños de efecto pequeños, medianos y grandes. Hay más detalles aquí . N
es el número total de puntos de datos, df
es el número de alelos. Esta función nos dará un valor de 1 menos la potencia de nuestra prueba. Un valor de 0,9 significa que hay un 10 % de probabilidad de no detectar un efecto que realmente existe.
Si queremos calcular un número adecuado de puntos de datos para recopilar, debemos decidir qué potencia queremos. Digamos que decidimos que una probabilidad de 0.01 de hacer la prueba, pero no detectar el desequilibrio, si existe, es aceptable.
pwr.chisq.test(w = 0.3, df = 4, sig.level = 0.05, power=0.99 )
nos dice que se necesitan 280 puntos de datos.
Sin estimaciones del tamaño del efecto o una cantidad de genotipos, es difícil dar una respuesta directa a su pregunta, pero 5 por genotipo parece muy pequeño.
Si solo tiene dos genotipos, puede optar por usar la prueba exacta de Fisher, en cuyo caso puede usarla power.fisher.test()
en el statmod
paquete. Las definiciones de tamaño del efecto y grados de libertad son ligeramente diferentes pero la idea es la misma.
nico
ben
timcdlucas