Tengo datos experimentales sobre la dependencia del campo magnético (B) en el centro de las bobinas de Helmholtz con la corriente en él (I).
I(A) B(Tl) I_error B_error
1.000 0.73e-3 0.02 0.04e-3
1.125 0.80e-3 0.02 0.04e-3
1.250 0.82e-3 0.02 0.04e-3
1.375 0.91e-3 0.02 0.03e-3
1.500 1.05e-3 0.02 0.03e-3
1.625 1.09e-3 0.02 0.03e-3
1.750 1.15e-3 0.02 0.03e-3
1.875 1.32e-3 0.02 0.03e-3
2.000 1.35e-3 0.02 0.02e-3
2.125 1.46e-3 0.02 0.02e-3
2.250 1.55e-3 0.02 0.02e-3
La teoría predice una dependencia lineal entre estas cantidades de la forma (es decir ). Ajuste en el modelo lineal de estos datos, obtengo el valor del parámetro (a o C) Tl/A.
Pero, cuando trato de usar el modelo (con distinto de cero ), Yo obtengo Tl/A con valor y con una gran desviación estándar (es decir ).
Por lo tanto, surge la pregunta, en cuyo caso obtuve el error correcto en el a
parámetro, cuando usé un modelo
(
) o un modelo
(
)?
Tl/A
o
Tl/A
El programa de adaptación es
GnuPlot
(GpFit.gp):
# ------------ Fitting ----------
set fit quiet
a = 6e-4;
f(x) = a*x + b;
set fit errorvariables;
fit f(x) ARG1 u 1:2:3:4 xyerrors via a,b;
# ------ Calculation of R^2 ------
stats "" u 2:($2 - (a*$1 + b)) nooutput
SST = STATS_stddev_x**2*STATS_records
SSE = STATS_sumsq_y
R2 = 1 - SSE/SST
# ------- Results ----------
set print ARG2
print "Parameter a: ", a
print "Standart Deviation of a: ", a_err
print "Parameter b: ", b
print "Standart Deviation of b: ", b_err
print "chi square: ", (FIT_STDFIT)**2
print "R square:" , R2
Para iniciar el uso del script
gnuplot -persist -c GnuFit.gp <input_data_file> <output_results_file>
Una vez que establece el origen como un punto de datos sin ningún error, es decir, el gráfico de mejor ajuste debe pasar por el origen, limita la cantidad de líneas posibles que se ajustan a los datos en comparación con el caso más general de suponer que es una relación lineal. .
Una cosa que no es inmediatamente obvia de su gráfico es que el punto de datos de valor más bajo está muy lejos del origen en comparación con el rango de los puntos de datos.
Incluir el origen muestra esto claramente, pero tenga en cuenta que la línea de mejor ajuste que se muestra a continuación ponderó cada uno de los puntos de datos por igual.
Cuando hiciste el experimento, ¿verificaste si había un error cero en el campo magnético y los dispositivos de medición de corriente? Un desplazamiento daría como resultado un gráfico que no pasa por el origen, aunque la teoría predice una proporcionalidad directa.
La incertidumbre de los parámetros de ajuste es específica del modelo de ajuste utilizado. Entonces, la pregunta no es qué incertidumbre es correcta, sino qué modelo debe usarse. En estadística existen herramientas para la selección de modelos (por ejemplo, validación cruzada, penalizaciones por cada parámetro de ajuste), así como para la "selección de puntos de datos para ajustes". Considero que la selección del punto de datos es más apropiada para su ejemplo. Por lo tanto, voy a desarrollar esto a continuación.
Una propiedad que suele tenerse en cuenta al realizar ajustes es el llamado apalancamiento . Es importante, porque si ajustamos con pesos constantes (cada punto de datos obtiene el mismo peso) los puntos de datos no influyen en el ajuste por igual. Por lo tanto, si agregamos un punto de datos en , este nuevo punto de datos es muy influyente en el ajuste. Como señaló Farcher, esto es lo que hace efectivamente al seleccionar el modelo .
Volviendo a tu pregunta original, te recomiendo que uses el modelo , porque se obtienen mayores incertidumbres. Desde mi perspectiva, es importante que seamos " conservadores ", porque los errores desconocidos suelen estar presentes. Por ejemplo, un análisis adecuado del sistema de medición consta de muchos estudios (resistencia y reproducción del indicador, sesgo, linealidad y estabilidad) del dispositivo de medición. Dado que esto no se realiza con frecuencia, no debemos confiar demasiado en nuestros resultados.
Connor Behan
sergi
Connor Behan