Incertidumbre en mediciones repetitivas

Suponga que ha adquirido algunos datos de una medición y tiene los siguientes números:

  • medida 1: 1.510 ± 0.085
  • medida 2: 1.608 ± 0.089
  • medida 3: 1.566 ± 0.059
  • medida 4: 1.638 ± 0.066
  • medida 5: 1.660 ± 0.071

Entonces tengo 5 valores con sus respectivas incertidumbres. Ahora me gustaría tomar el valor medio de estos 5 e informar la desviación estándar. Tres escenarios están frente a mis ojos:

  1. Tomo la media y calculo la sd usando solo los valores sin errores, y obtengo una media de 1.596 ± 0.060 ;

  2. Calculo el sd usando la fórmula de propagación de errores, donde q = A + B , entonces d q = ( d A 2 + d B 2 ) 1 / 2 , y sumo en cuadratura los 5 errores informados anteriormente y obtengo un valor de 1.596 ± 0.168 , bien mayor con respecto al caso 1;

  3. Tomo la media de los errores de las 5 medidas que tengo con un valor de 1.596 ± 0.074 .

Estoy realmente confundido porque no puedo entender cómo manejar el caso en el que tienes que promediar algunos datos que tienen errores. Si alguien tiene algunas pistas y sugerencias, sería muy apreciado.

Respuestas (4)

En general, siempre se deben usar todos los datos disponibles para hacer deducciones. Si tiene la suerte de tener límites de incertidumbre en sus mediciones repetidas, eso significa que esas incertidumbres también son un tipo de datos, e idealmente deberían usarse para refinar la conclusión.

Lo que haría es usar un método ponderado: si asumimos que el ruido y la incertidumbre son gaussianos, los puntos con poca incertidumbre deberían tener un peso más alto que los puntos más inciertos. Ver esta pregunta y su respuesta . En este caso queremos maximizar el log-verosimilitud registro ( yo ) = C ( 1 / 2 ) i ( y i m ) 2 / σ i 2 dónde a es el medio buscado y σ i es la incertidumbre para cada uno de los puntos de datos. la derivada es i ( y i m ) / σ i 2 que es cero para la media ponderada

m = i y i / σ i 2 i ( 1 / σ i 2 ) .
De manera similar, se puede calcular una desviación estándar ponderada :
σ = norte i ( y i m ) 2 / σ i 2 ( norte 1 ) i ( 1 / σ i 2 ) .

Pero tenga en cuenta que mucho depende del modelo que esté utilizando. Las incertidumbres no necesariamente tienen que ser gaussianas.

¡Muchas gracias por la respuesta aclaratoria! no solo para ti, Anders, sino también para otros usuarios. Me ayudó mucho.
Los anteriores son la media y la desviación estándar de las muestras, y son las mejores estimaciones para la media y la desviación estándar desconocidas de la población.

Tenemos que tener cuidado aquí. Suponga que los datos que informa en su pregunta son medias y desviaciones estándar de las medias de una serie de muestras aleatorias. Eso es, 1.510 ± 0.085 es la media ± la desviación estándar de la media de una muestra que consta de varias mediciones individuales, 1,608±0,089 es la media ± la desviación estándar de la media de otra muestra que consta de varias mediciones individuales, y así sucesivamente.

Considere una serie de i = 1 , 2 , . . . , k muestras aleatorias, la i t h muestra compuesta por norte i valores específicos para la variable aleatoria de interés. Cada muestra puede tener un número diferente de valores específicos. Para cada muestra, evalúa e informa la media y la desviación estándar de la media. la media de la i t h la muestra es metro i = 1 norte i j norte i y j i dónde y j i es el j t h valor en el i t h muestra. La desviación estándar de la media de la i t h la muestra es S i = s i 2 norte i dónde s i = j norte i ( y j i metro i ) 2 norte i 1 es la desviación estándar de la i t h muestra.

La mejor estimación para la media es metro b mi s t = i = 1 k metro i / S i 2 i = 1 k 1 S i 2 y la mejor estimación para la desviación estándar de la media es S b mi s t = ( i = 1 k 1 S i 2 ) 1 / 2 . tu reportas metro b mi s t ± S b mi s t para su resultado final.

Nota: Los valores de la muestra significan metro b mi s t y desviación estándar S b mi s t son las mejores estimaciones para la media de los valores desconocidos de la población m y desviación estándar de la media σ m .

(Por ejemplo, consulte el texto Análisis de datos para científicos e ingenieros de Meyer para obtener más información).

Anders S ya te ha dado una muy buena respuesta, pero quiero mostrarte dónde te equivocaste en tu razonamiento.

Calculo el sd usando la fórmula de propagación de errores, donde q = A + B , entonces d q = ( d A 2 + d B 2 ) 1 / 2 , y sumo en cuadratura los 5 errores informados anteriormente y obtengo un valor de 1.596 ± 0.168 , bien mayor con respecto al caso 1;

Esto calcula el error en la suma de sus medidas. Con este método obtienes que la suma de tus medidas es 7.982 ± 0.168 .

Pero para obtener el promedio, tomó esta suma y luego la dividió por el número de mediciones . Dado que el número de mediciones es un número exacto sin incertidumbre, puede obtener el error en el promedio dividiendo el error en la suma por el mismo número.

Entonces deberías tener 1.596 ± 0.036 por este método, en lugar de ± 0.168 . Y habría mejorado su error en relación con tomar una sola medición.

Sin embargo, al usar el método de Anders, obtendrá un error aún menor.

Si sus medidas se distribuyen normalmente (y se pueden ignorar las incertidumbres sistemáticas), podría usar la media de los valores y la desviación estándar de la media (SDOM) como su incertidumbre final. Es sencillo

S D O METRO : σ X ¯ = σ X norte
dónde σ X es solo su desviación estándar de sus medidas y N es su número de medidas.

"An Introduction to Error Analysis" de John Taylor describe esto como "la incertidumbre en nuestra mejor estimación para x (es decir, X ¯ ) es el...SDOM" dadas las condiciones anteriores.