¿Cuál es el tamaño mínimo de muestra para mostrar la barra de error en un experimento?

En los experimentos científicos, las personas a menudo intentan mostrar una barra de error basada en la desviación estándar alrededor de un valor medio (promedio).

Mi pregunta es doble:

  1. ¿Cómo estimar los tamaños de muestra mínimos pero adecuados (espacio) para calcular la barra de error en un experimento para hacer una gráfica significativa y predictiva? Supongo que podría depender de la precisión del equipo y del requisito de precisión del experimento dado.

  2. ¿Depende el tamaño mínimo de la muestra del tipo de cantidades físicas medidas? Me refiero a si el espacio de muestra adecuado cambiará según la cantidad de interés, por ejemplo, velocidad, temperatura, espesor.

¡Gracias por cualquier consejo y referencia recomendada!

Vale la pena señalar que si no cree que la barra de error signifique algo, entonces ha admitido que no sabe nada sobre la validez de sus datos. Podría decirse que no debería mostrar ese tipo de datos en absoluto. Además, enlace cómico obligatorio: phdcomics.com/comics.php?f=1816
Definitivamente mira el teorema de Bayes . Es la única manera de entender realmente esto.

Respuestas (1)

A juzgar por su Q1, creo que está preguntando acerca de las barras de error para puntos de datos en gráficos, especialmente en relación con el trazado de una línea o curva de mejor ajuste.

Las barras de error a menudo no se calculan estadísticamente para este propósito. Para ello, se debe realizar una muestra de N medidas para cada valor elegido de la variable independiente x y calcular una media y una DE. El error estándar de la media sería entonces SE = SD/sqrt(N). Entonces, la barra de error podría colocarse en la media +/- 1 o 2 x SE, dando un aprox. Intervalo de confianza del 70% o 95%. El valor de SE se aplica estrictamente solo a este punto de datos. Deben calcularse valores separados para cada punto de datos en el gráfico. Sin embargo, si se piensa que el SE no varía mucho con x, el cálculo se puede hacer para un valor de x cerca de la mitad del rango y ese valor se aplica en todo.

Sin embargo, muy pocos experimentos se realizan con tanto detalle. En cambio, el rango de posible error generalmente se estima a partir de la precisión del componente menos preciso de la medición. También repetiría cada medición al menos dos veces, si es posible tomando medidas en ambas direcciones (aumento y disminución en la variable de control). Esto también le daría más confianza en un tamaño apropiado para la barra de error, pero incluso si traza solo la media de estas lecturas repetidas, por lo general no se molestaría en calcular la DE para una muestra tan pequeña.

Una alternativa es trazar todas las medidas en lugar de promediarlas. Si va a realizar un análisis de regresión de mínimos cuadrados en los datos para ajustar una línea o curva, entonces es posible incluir el tamaño de la barra de error para cada punto de datos (el software de ajuste de curvas generalmente incluye esta entrada), pero es mucho más fácil (especialmente si está haciendo sus propios cálculos) incluir todas las medidas repetidas (si las tiene).

Por supuesto, es esencial tener una estimación del error para los resultados de su experimento, por ejemplo, la pendiente y la intersección de la línea de mejor ajuste.

Las barras de error no son particularmente útiles en los gráficos, excepto como un resumen pictórico de las lecturas repetidas (para evitar que el gráfico se sature demasiado con múltiples puntos de datos) o de la incertidumbre estimada en la precisión de los dispositivos de medición. Puede ver el primer tipo, especialmente en la física de partículas, donde cada punto de datos es un resumen de millones de colisiones de partículas. La barra de error le indica a su lector su confianza en la precisión del punto de datos. Ya sea que esto provenga de la propagación de lecturas repetidas o de la precisión que se puede obtener de sus dispositivos de medición, no importa mucho; probablemente será una combinación subjetiva de los dos. Lo importante es que: (i) debe ser una estimación justa, ni demasiado grande ni demasiado pequeña como para inducir a error;

"Las barras de error a menudo no se basan en la desviación estándar de la media". Creo que esto es exagerado, esto probablemente depende del subcampo, pero veo muchos de esos gráficos. Sin embargo, estoy de acuerdo en que es más una opción de presentación.