En la regresión de datos, ¿debería forzarse el intercepto yyy a un valor de acuerdo con el modelo?

Tengo un modelo teórico de la forma

y = k X
Digamos que mido experimentalmente los pares de datos ( y , X ) , a partir del cual quiero determinar el valor de k . Estoy usando la función de ajuste de curvas de MS Excel (que supongo que usa el método de regresión lineal). Es decir, trazo el y datos en función de la X datos, y luego aplique un ajuste de tendencia "lineal" a la gráfica de datos para obtener el valor de k . Mis datos ( y , X ) indudablemente tendrá error (como se discutió en las respuestas y comentarios en esta publicación de PSE ). Al crear el ajuste de la curva, tengo la opción de establecer la intersección y en cero, es decir, hacer que la línea ajustada pase por el origen del gráfico. Este sería el resultado predicho por el modelo teórico.

Alternativamente, el ajuste de la curva se puede hacer de tal manera que la intersección y sea el valor que mejor se ajuste a los datos, lo que cambiaría el valor determinado para k .

Mirando más allá del hecho de que estoy usando MS Excel, ¿cuál es la mejor práctica para hacer una regresión de los datos para encontrar el parámetro? k ? ¿Debo forzar la regresión para que se ajuste a los datos y la y -intercepción en cero o no?

Respuestas (2)

Si crees en el modelo, debes encontrar la pendiente ajustando y = k X . La solución de mínimos cuadrados, para datos con errores idénticos, es k = X y ¯ / X 2 ¯ .

¿Deberías creerle al modelo? Esa es una pregunta totalmente diferente . No los confunda. Calculando el x 2 sería un buen lugar para empezar.

En cualquier caso, no debería usar Excel para nada seriamente científico. Guárdelo para sus formularios de gastos.

Para aclarar, si el modelo de voltaje es V = I R , y tenemos los datos como se muestra en esta publicación de PSE ( physics.stackexchange.com/questions/55534/… ), el ajuste debe hacerse para que la intersección y sea cero y encontremos el mejor valor para R (¿Cuál es la pendiente de la línea de los datos con intersección en y = 0)?

Si está obteniendo datos de estiramiento de primavera, la respuesta debería ser que no fuerce que la intersección y sea cero. Para tales datos, los resortes nuevos tienen cierta resistencia que requiere que se les aplique una pequeña cantidad de fuerza (por ejemplo, un pequeño peso colgante) antes de que muestren algún estiramiento. Este es un efecto real, es equivalente a un resorte "demasiado comprimido" y sin duda se debe al proceso de fabricación del resorte. Además, ya sea que su proceso esté estirando un resorte o no, debe obtener datos en el rango que pueda verificar si está tratando con tal efecto y asegurarse de que su modelo matemático coincida con los datos experimentales.

De acuerdo, la pregunta sobre cuál es la mejor práctica para la regresión de datos para resolver los parámetros es interesante. Por un lado, la regresión de intercepción finita podría decirle algo sobre los datos, por ejemplo, sufre algún tipo de error experimental o está sujeto a fenómenos que no se tienen en cuenta en el modelo que asume que lo gobierna (su ejemplo de resorte 'demasiado comprimido') . Por otro lado, si todo lo que sabe es el modelo "teórico" y cree que ese modelo es "verdadero", entonces parece que debería elegir la opción de intersección cero para alinearse con el modelo...
...Del mismo modo, si esta opción muestra que el ajuste al modelo es "pobre", entonces indica que hay algo mal con sus medidas. Si fuera un fabricante de resortes y tuviera que informar la constante del resorte k , según el modelo y = k X , ¿sería una buena práctica usar el enfoque de intersección cero para encontrar k y luego reportar la incertidumbre asociada con ese k ?
@Armadillo, para el ejemplo del resorte, una vez que se agrega una pequeña cantidad de peso a un resorte "comprimido", sigue la Ley de Hooke, que se puede demostrar mediante un experimento. Por lo tanto, no hay nada de malo en usar la ecuación que realmente representa ese resorte en particular, especialmente si está usando ese resorte como elemento de otro experimento.
¿Qué pasa si el intercepto en y es un valor positivo? Es decir, la línea de mejor ajuste muestra que el resorte se estira cuando la fuerza sobre el resorte es cero. ¿Sigues sugiriendo que no fuerce el intercepto en y para que sea cero?
@Armadillo, creo que quiere decir qué pasa si la intersección y es negativa (es decir, se necesita fuerza de compresión para que el resorte vuelva a su longitud original y usted está ajustando la longitud del resorte a la curva frente a la fuerza de estiramiento). La respuesta depende de si ajusta o no los datos a la longitud original del resorte oa la longitud estirada del resorte.
No, eso no es lo que quiero decir. El eje y es el cambio en la longitud del resorte (estiramiento) y el eje x es la fuerza aplicada. Una intercepción negativa indica "demasiado comprimido" como explicaste. Mi pregunta para usted es ¿qué sucede si sus datos muestran el mejor ajuste para tener una intersección y positiva? Tenga en cuenta que toma un punto de datos inicial como 0 fuerza aplicada, no hay estiramiento, por lo tanto, el par (0,0) es un punto de datos en su conjunto de datos.
@Armadillo, para un resorte ideal, use la ley de Hooke. Para un resorte particular del mundo real, use la ecuación que se ajuste a los datos experimentales.