Best Fit con función lineal y un problema de "cero"

Tengo datos experimentales sobre la dependencia del campo magnético (B) en el centro de las bobinas de Helmholtz con la corriente en él (I).

I(A)  B(Tl)   I_error B_error
1.000 0.73e-3 0.02 0.04e-3
1.125 0.80e-3 0.02 0.04e-3
1.250 0.82e-3 0.02 0.04e-3
1.375 0.91e-3 0.02 0.03e-3
1.500 1.05e-3 0.02 0.03e-3
1.625 1.09e-3 0.02 0.03e-3
1.750 1.15e-3 0.02 0.03e-3
1.875 1.32e-3 0.02 0.03e-3
2.000 1.35e-3 0.02 0.02e-3
2.125 1.46e-3 0.02 0.02e-3
2.250 1.55e-3 0.02 0.02e-3

La teoría predice una dependencia lineal entre estas cantidades de la forma B = C I (es decir y = a X ). Ajuste en el modelo lineal y = a X de estos datos, obtengo el valor del parámetro (a o C) C = ( 6.83 ± 0.05 ) 10 4 Tl/A.

Pero, cuando trato de usar el modelo y = a X + b (con distinto de cero b ), Yo obtengo C = ( 6.83 ± 0.24 ) 10 4 Tl/A con valor b = 0.013 10 4 y con una gran desviación estándar Δ b = 0.46 10 4 (es decir b Δ b ).

Por lo tanto, surge la pregunta, en cuyo caso obtuve el error correcto en el aparámetro, cuando usé un modelo y = a X + b ( Δ a = 0.24 10 4 ) o un modelo y = a X ( Δ a = 0.05 10 4 )?


C = ( 6.83 ± 0.05 ) 10 4 Tl/A

o

C = ( 6.83 ± 0.24 ) 10 4 Tl/A

?

ingrese la descripción de la imagen aquíEl programa de adaptación es GnuPlot(GpFit.gp):

# ------------ Fitting ----------
set fit quiet
a = 6e-4;
f(x) = a*x + b; 
set fit errorvariables;
fit f(x) ARG1 u 1:2:3:4  xyerrors via a,b; 

# ------ Calculation of R^2 ------

stats "" u 2:($2 - (a*$1 + b)) nooutput
SST = STATS_stddev_x**2*STATS_records
SSE = STATS_sumsq_y
R2 = 1 - SSE/SST
 
# ------- Results ----------

set print ARG2
print "Parameter a: ", a
print "Standart Deviation of a: ", a_err
print "Parameter b: ", b
print "Standart Deviation of b: ", b_err
print "chi square: ", (FIT_STDFIT)**2
print "R square:" , R2

Para iniciar el uso del script

gnuplot -persist -c GnuFit.gp <input_data_file> <output_results_file>
Si tu crees b = 0 y solo quieren medir el valor de a , utiliza el primero. Si desea probar experimentalmente si b = 0 también, usa el segundo.
@ConnorBehan Ok, supongamos que también quiero probar experimentalmente si b = 0, y uso el segundo, luego obtengo b << Delta b, ¿qué debo concluir?
La conclusión sería que b es indistinguible de cero.

Respuestas (2)

Una vez que establece el origen como un punto de datos sin ningún error, es decir, el gráfico de mejor ajuste debe pasar por el origen, limita la cantidad de líneas posibles que se ajustan a los datos en comparación con el caso más general de suponer que es una relación lineal. .

Una cosa que no es inmediatamente obvia de su gráfico es que el punto de datos de valor más bajo está muy lejos del origen en comparación con el rango de los puntos de datos.
Incluir el origen muestra esto claramente, pero tenga en cuenta que la línea de mejor ajuste que se muestra a continuación ponderó cada uno de los puntos de datos por igual.

ingrese la descripción de la imagen aquí

Cuando hiciste el experimento, ¿verificaste si había un error cero en el campo magnético y los dispositivos de medición de corriente? Un desplazamiento daría como resultado un gráfico que no pasa por el origen, aunque la teoría predice una proporcionalidad directa.

"¿El experimento verificó si había un error cero en el campo magnético y los dispositivos de medición de corriente?" Sí, lo comprobé. Para obtener un punto, tomé diez lecturas, cada vez volviendo la corriente a cero y elevándola nuevamente al deseado.

La incertidumbre de los parámetros de ajuste es específica del modelo de ajuste utilizado. Entonces, la pregunta no es qué incertidumbre es correcta, sino qué modelo debe usarse. En estadística existen herramientas para la selección de modelos (por ejemplo, validación cruzada, penalizaciones por cada parámetro de ajuste), así como para la "selección de puntos de datos para ajustes". Considero que la selección del punto de datos es más apropiada para su ejemplo. Por lo tanto, voy a desarrollar esto a continuación.

Una propiedad que suele tenerse en cuenta al realizar ajustes es el llamado apalancamiento . Es importante, porque si ajustamos con pesos constantes (cada punto de datos obtiene el mismo peso) los puntos de datos no influyen en el ajuste por igual. Por lo tanto, si agregamos un punto de datos en ( I , B ) = ( 0 , 0 ) , este nuevo punto de datos es muy influyente en el ajuste. Como señaló Farcher, esto es lo que hace efectivamente al seleccionar el modelo y = a X .

Volviendo a tu pregunta original, te recomiendo que uses el modelo y = a X + b , porque se obtienen mayores incertidumbres. Desde mi perspectiva, es importante que seamos " conservadores ", porque los errores desconocidos suelen estar presentes. Por ejemplo, un análisis adecuado del sistema de medición consta de muchos estudios (resistencia y reproducción del indicador, sesgo, linealidad y estabilidad) del dispositivo de medición. Dado que esto no se realiza con frecuencia, no debemos confiar demasiado en nuestros resultados.

“Te recomiendo que uses el modelo 𝑦=𝑎𝑥+𝑏, porque obtienes mayores incertidumbres. Desde mi perspectiva es importante que seamos "conservadores". Nunca lo había pensado de esa manera, pero esa es una excelente manera de verlo.