¿Qué es la varianza muestral de la varianza muestral y qué es la distribución muestral teórica?

Question

¿Qué es la varianza muestral de la varianza muestral y qué es la distribución muestral teórica?

Estadísticas
Matemáticas
probabilidad
computacion-algebra-sistemas

Calidad

Estoy tratando de trabajar algunas cosas en R y tengo problemas para entender algunas de las instrucciones.

yo generé $1000$ muestras de tamaño $5$ de la distribución normal estándar, y calculé la media de la varianza muestral de estas. Ahora quiero saber cuál es la varianza muestral de mi muestra de varianzas muestrales. Pero no estoy seguro de entender realmente lo que esto significa, ni cómo implementar esto en R.

Además, se me pide que superponga el histograma que generé a partir de mi muestra con un histograma de la densidad teórica de la distribución de muestreo. ¿Qué quiere decir esto? Es decir, qué se entiende por densidad teórica de la distribución muestral de la varianza muestral.

Sé que todas mis muestras provienen del estándar normal, donde $\sigma^{2}=1$

y se que si $X_{N}=X_{1}+...+X_{1000}$ sería $N(0,\frac{\sigma^{2}}{1000})$ , ¿es esto a lo que se refiere?

Agradeceré cualquier ayuda y consejo. Gracias

Respuestas (1)

¿Qué es la varianza muestral de la varianza muestral y qué es la distribución muestral teórica?

bruceet · Answer 1

La distribución de la varianza de la muestra $S^2$ es dado por $(n-1)S^2/\sigma^2 \sim \chi^2(n-1)$ . Supongo que se le pide que brinde una ilustración de esta relación usando R. Considere la siguiente simulación.

 m = 1000;  n = 5;  x = rnorm(m*n)
 DTA = matrix(x, nrow=m)  # each row a sample of size n
 v = apply(DTA, 1, var)   # sample variances of m rows
 hist((n-1)*v, prob=T, col="wheat", ylim=c(0,.2))
   curve(dchisq(x, n-1), lwd=2, col="blue", add=T)
   lines(density((n-1)*v), lwd=2, col="darkgreen")
 mean(v)
 ## 1.003081 
 var(v)
 ## 0.4881987

Puede que esto no sea exactamente lo que se le pide, pero puede indicarle la dirección correcta. He superpuesto una curva de densidad en el histograma. No estoy seguro de qué tipo de histograma podría superponerse.

Probablemente, un mensaje importante aquí es que la distribución chi-cuadrada relevante tiene df = n-1, no df = n. Puedes intentar superponer la densidad de $Chisq(5)$ y verás que no se ajusta del todo bien al histograma.

$Addendum:$ No sé si conoces los estimadores de densidad, pero en buena medida, también superpuse un estimador de densidad (histograma suavizado) en verde. Para esta simulación en particular, ejecute la curva teórica y el estimador de densidad concuerdan bastante bien, pero si ejecuta el programa varias veces obtendrá algunos casos en los que la concordancia no es tan buena. (Si usa m = 10,000, los resultados serán más estables).

Por favor, avíseme si puede encontrarle sentido a esto para terminar su proyecto. ¿Cuál es la varianza de $Chisq(4)$ ? Si no lo sabe, consulte el artículo de Wikipedia sobre 'Distribución de chi-cuadrado'.

Anexo por comentario de @Quality: Porque $(n-1)S^2/\sigma^2 \sim Chisq(4),$ tenemos $V[4S^2] = 2(4)$ o $V(S^2) = 8/16 = 1/2$ . Asimismo, ven el programa representa $S^2,$ por lo que no es de extrañar que var(v)regrese $0.488 \approx 0.5$ dentro del error de simulación. (Debido a que las varianzas están en una escala de unidades al cuadrado, el margen de error de la simulación es numéricamente mayor para las varianzas que para las medias: varias ejecuciones adicionales del programa dieron valores entre 0,47 y 0,59. Use para una ejecución más lenta con mayor precisión) m=10^6.

Gracias hasta ahora, sí, a partir de ahora había calculado sample.var(n=5,N=1000) y una media(sample.var(n=5,N=1000)) solo para ver qué estaba pasando. Además, sí, estoy familiarizado con el chi cuadrado y su relación con lo que tenía arriba. Entonces, para algunas aclaraciones, los ladrillos amarillos representan los resultados de las muestras, mientras que las líneas son del chi cuadrado. Muy apreciado.
¿Puedes ayudar a explicar esto? Por ejemplo, cuando lo busco, veo que el valor esperado de chi cuadrado con n grados de libertad es n, y la varianza es 2n, así que esto no implicaría aparentemente que en mi ejemplo anterior, el valor esperado era 4.
@Calidad: puse otro 'Anexo' al final de mi Respuesta, que espero ayude a resolver este problema.

¿Qué es la varianza muestral de la varianza muestral y qué es la distribución muestral teórica?

Calidad

Respuestas (1)

bruceet

Calidad

Calidad

bruceet

¿Por qué los límites de esta integral no consideran ambas igualdades?

Estimación de la desviación estándar de la población con la desviación estándar de la muestra

¿Usando pdf X para encontrar pdf Y, y deduciendo los límites en los que la función de densidad de probabilidad de Y es válida?

Estimación del parámetro de máxima verosimilitud: asumiendo la media de las observaciones

x cantidad de personas poseía una cabra, y cantidad de personas poseía un camello, z cantidad de personas poseía un animal u otro pero no ambos

Ben y Jordan tienen tres monedas entre ellos. Dos de ellos son justos, pero uno de ellos tiene una probabilidad de 4/7 de sacar cara.

¿Cuál es la probabilidad de que la moneda se lance tres veces?

Una pregunta trivial sobre la predicción de la tasa de llegada de un proceso de Poisson a partir de datos de muestra

Distribución de gaussianas conjuntas condicionadas a su suma

Normalidad asintótica del estimador del parámetro de distribución uniforme