¿Por qué la ecuación de Euler-Lagrange no es trivial?

La ecuación de Euler-Lagrange da las ecuaciones de movimiento de un sistema con Lagrangian L . Dejar q α representar las coordenadas generalizadas de una variedad de configuración, t representar el tiempo. El Lagrangiano es una función del estado de una partícula, es decir, la posición de la partícula q α y velocidad q ˙ α . La ecuación de Euler-Lagrange es

d d t L q ˙ α = L q α

¿Por qué es esto una ley de la física y no una simple trivialidad para cualquier función ? L sobre las variables q α y q ˙ α ? La siguiente "demostración" de la Ecuación de Lagrange no usa física y parece sugerir que la Ecuación de Lagrange es simplemente un hecho matemático que funciona para cada función.

d d t L q ˙ α = q ˙ α d L d t conmutatividad de derivadas   = L ˙ q ˙ α   = L q α cancelación de puntos

Esto no puede ser correcto, o de lo contrario a nadie le importaría un comino esta ecuación y sería totalmente inútil para resolver cualquier problema. ¿Qué tiene de malo el razonamiento lógico anterior?

Puede requerir la ecuación EL para cualquier funcional. Sin embargo, su tesis de que es una identidad general es incorrecta. ¿De dónde sacaste las ideas para los pasos 1 y 3?
Se han eliminado varios comentarios que respondían a la pregunta. Tenga en cuenta que los comentarios están destinados a solicitar aclaraciones o sugerir mejoras a la publicación principal, no para responder a la pregunta.
En realidad, para derivar ecuaciones EL se involucra uno de los principios más importantes de la física, conocido como Principio Variacional o Principio de Hamilton. Este principio, del que se derivan los EL, establece que el camino que seguirá el objeto, si lo dejas moverse libremente, es el que desvanece la variación de la acción. S . en fórmula, d S = 0

Respuestas (7)

Ah, qué error tan complicado has cometido allí. El problema es que simplemente has confundido algunas nociones en cálculo multivariable. Sin embargo, no se sienta mal, esto generalmente está muy mal explicado. Los pasos 1 y 3 anteriores son incorrectos. Tenga la seguridad de que la ecuación de Euler-Lagrange no es trivial.

Primero demos un paso atrás. El Lagrangiano para una partícula que se mueve en una dimensión en una energía potencial externa V ( q ) es

L ( q , q ˙ ) = 1 2 metro q ˙ 2 V ( q ) .
Así es como la mayoría de la gente lo escribe. Sin embargo, esto es muy confuso, porque claramente q y q ˙ no son variables independientes. Una vez q se especifica para todos los tiempos, q ˙ también se especifica para todos los tiempos.

Una mejor manera de escribir el Lagrangiano anterior podría ser

L ( a , b ) = 1 2 metro b 2 V ( a ) .
Aquí hemos expuesto el Lagrangiano por lo que realmente es: una función que toma dos números y genera un número real. Asimismo, podemos ver claramente que
L a = V ( a ) L b = metro b .
Por lo general, la mayoría de la gente escribe esto como
L q = V ( q ) L q ˙ = metro q ˙ .
Sin embargo, q y q ˙ deben entenderse como variables independientes para poder hacer esto correctamente. Tal como a y b eran variables independientes, q y q ˙ también lo son cuando se ponen en el Lagrangiano. En otras palabras, podríamos poner dos números cualesquiera en L ; simplemente decidimos poner q y q ˙ .

Además, veamos la derivada del tiempo total d d t . ¿Cómo debemos entender la siguiente expresión?

d d t L ( q ( t ) , q ˙ ( t ) )
Ambos q y q ˙ son funciones del tiempo. Por lo tanto, L ( q ( t ) , q ˙ ( t ) ) depende del tiempo simplemente porque q ( t ) y q ˙ ( t ) hacer. Por lo tanto, para evaluar la expresión anterior, necesitamos usar la regla de la cadena en el cálculo multivariable.
d d t L ( q ( t ) , q ˙ ( t ) ) = d q d t L a ( q ( t ) , q ˙ ( t ) ) + d q ˙ d t L b ( q ( t ) , q ˙ ( t ) ) = q ˙ ( t ) L a ( q ( t ) , q ˙ ( t ) ) + q ¨ ( t ) L b ( q ( t ) , q ˙ ( t ) )

En la expresión anterior, una vez más usé a y b para que quede más claro mi punto. Tenemos que sacar derivadas parciales de L asumiendo a y b son variables independientes. DESPUÉS de diferenciar, ENTONCES evaluamos L / a y L / b al enchufar ( q , q ˙ ) en el ( a , b ) tragamonedas Esto es como en el cálculo de una sola variable, si tiene

F ( X ) = X 2
y quieres encontrar F ( 3 ) , primero diferencia F ( X ) mientras se mantiene X una variable no especificada, y ENTONCES conecte X = 3 .

En tu primer paso, las derivadas NO conmutan porque t y q no son independientes. ( q depende de t .) Sí, las derivadas parciales conmutan, pero SÓLO si las variables son independientes. En su tercer paso, no puede "cancelar los puntos" porque L depende de dos entradas. Si L solo dependía de q , entonces sí, podría "cancelar los puntos" (ya que esto es equivalente a la regla de la cadena en el cálculo de una sola variable), pero no es así, por lo que no puede hacerlo.

EDITAR: puede ver por sí mismo que la ecuación de Euler-Lagrange no es idéntica 0 . Si tomas el Lagrangiano L ( q , q ˙ ) He escrito arriba y lo conecto a la ecuación de Euler Lagrange, obtienes

metro q ¨ ( t ) + V ( q ( t ) ) = 0.
Esto no es lo mismo que 0 = 0 . Es una condición que un camino q ( t ) tendría que satisfacer para extremizar la acción. Si era 0 = 0 , entonces todos los caminos extremizarían la acción.

EDITAR: Como señala Arthur, este también es un buen momento para discutir la diferencia entre d L / d t y L / t . Si tenemos un Lagrangiano dependiente del tiempo,

L ( q , q ˙ , t )
después L puede depender de t explícitamente, a diferencia de sólo a través de q y q ˙ . Entonces, por ejemplo, donde podríamos tener el Lagrangiano para una partícula en un campo gravitacional constante gramo es
L ( a , b ) = 1 2 metro b 2 metro gramo a
si dejamos permitir L depender de t explícitamente, podríamos hacer que el campo gravitatorio se vuelva más fuerte a medida que pasa el tiempo:
L ( a , b , t ) = 1 2 metro b 2 metro ( C t ) a .
( C es una constante tal que C t tiene las mismas unidades que gramo .)

La cantidad

t L ( a , b , t )
debe entenderse como diferenciando el " t -ranura" de L . En el ejemplo anterior, tendríamos
t L ( a , b , t ) = metro C a .
La cantidad
d d t L ( q ( t ) , q ˙ ( t ) , t )
debe entenderse como la derivada a tiempo completo de L Debido al hecho de que q y q ˙ también depender de t . Para el ejemplo anterior,
d d t L ( q ( t ) , q ˙ ( t ) , t ) = q ˙ ( t ) L a ( q ( t ) , q ˙ ( t ) , t ) + q ¨ ( t ) L b ( q ( t ) , q ˙ ( t ) , t ) + L t ( q ( t ) , q ˙ ( t ) , t ) = ( q ˙ ) ( metro C t ) + q ¨ ( t ) ( metro q ˙ ( t ) ) metro C q ( t )

Gracias por una respuesta completa. Necesitamos más de esos en Stack Exchange Network.
Las ecuaciones de Euler-Lagrange fue la primera vez que aprecié correctamente la diferencia entre y d en derivados. Por ejemplo, dada una función L ( t , q , q ˙ ) , la expresion L t significa "Derivar la función multivariable L ( t , q , q ˙ ) con respecto a la primera variable", mientras que d L d t significa "Diferenciar la función de variable única L ( t , q ( t ) , q ˙ ( t ) ) con respecto a la variable t ".
+1 soy un gran fan de escribir L ( a , b ) para enfatizar que L sólo depende de dos variables. Pero tal vez ayudaría enfatizar un pequeño detalle: que al calcular la acción (y por lo tanto encontrar las ecuaciones EL), conectamos funciones de tiempo q ( t ) y q ˙ ( t ) por a y b . De lo contrario, parece que el Lagrangiano es una función del tiempo y, sin embargo, al mismo tiempo, no lo es.
  1. el conmutador

    (1) [ q ˙ j , d d t ]   = ( 2 )   q j
    de una derivada de velocidad q ˙ j con la derivada del tiempo total
    (2) d d t   =   t + q ˙ j q j + q ¨ j q ˙ j + q j q ¨ j +
    no es cero Consulte también, por ejemplo, esta publicación relacionada con Math.SE y esta publicación relacionada con Phys.SE.

  2. La cancelación de puntos

    (3) L ˙ q ˙ j   =   L q j
    trabaja para funciones L ( q , t ) que no dependen de las velocidades q ˙ k . Pero un Lagrangiano normalmente depende de las velocidades. Consulte también esta publicación Phys.SE relacionada.

  3. Tenga en cuenta el siguiente lema algebraico de Poincaré:

    L  satisface las ecuaciones de Euler-Lagrange (EL). idénticamente 
    (4)
    L  es una derivada del tiempo total
    (módulo posibles obstrucciones topológicas). Para obtener más información, consulte, por ejemplo, esta y esta publicación de Phys.SE.

Me gustó más tu respuesta, fue breve, muy concisa y directa al grano. Ojalá pudiera haberlo escrito.

Entonces, en principio, uno puede elegir esencialmente a norte y Lagrangiano L con coordenadas suficientemente elegidas (y posiblemente restricciones), y aplicarle cálculo variacional a través de las ecuaciones de Euler-Lagrange. Las ecuaciones de movimiento que esto produce pueden o no corresponder a un modelo comprensible de la realidad. Hay muchos lagrangianos que no corresponden a la realidad (aparentemente). Los lagrangianos que producen modelos físicos se han encontrado generalmente mediante adivinanzas y comprobaciones y consultas con experimentos/observaciones.

¿Por qué es esta una ley fundamental de la física y no una simple trivialidad de CUALQUIER función L sobre las variables? q y q ˙ ?

El formalismo de Euler-Lagrange no es una " ley fundamental de la física". Más bien, es una ecuación diferencial parcial (o un conjunto de ellas) cuyas soluciones hacen que un funcional particular sea estacionario, lo que significa que las soluciones obedecen al principio de acción extrema. Este concepto matemático en realidad fue generalizado en la teoría de control por el principio máximo de Pontryagin . Las leyes de la física se pueden derivar a través del método de Euler-Lagrange, pero el método no es fundamental, de manera similar a cómo la geometría particular elegida no es fundamental .(párr. 17) para derivar leyes físicas. Los físicos usan las matemáticas para modelar la realidad, así que, por supuesto, ¡vamos a usar las cosas que funcionan! Por ejemplo, Einstein derivó sus ecuaciones de campo heurísticamente, pero Hilbert las derivó (alrededor de la misma época) del principio de acción adivinando el valor correcto. L . Pero hoy en día, casi todos los que trabajan con la relatividad general o la gravedad modificada parten de L y usan el principio de acción (excepto en cosmología que típicamente comienzan desde la métrica misma).

No es del todo sorprendente que, dado que somos criaturas naturales que evolucionaron para comprender los patrones de nuestro entorno, las herramientas que creamos, especialmente las abstractas como las matemáticas, puedan tener alguna correspondencia con la realidad. Eugene Wigner escribió un ensayo muy bueno sobre este tema, llamado "La efectividad irrazonable de las matemáticas en las ciencias naturales", en el que argumenta que es obvio que las matemáticas funcionan tan bien para modelar la realidad, pero no es del todo obvio por qué funciona. .

Las preguntas de "por qué" son muy difíciles de responder, y esta es especialmente difícil. Algunos lagrangianos trabajan en la producción de modelos físicos, y otros no, y tal vez las ecuaciones EL funcionen como un filtro para averiguarlo, ya que se pueden usar para hacer predicciones comprobables.

@ AccidentalFourierTransform ya aclaró sus errores matemáticos, así que no lo haré.

No sigo tu argumento de que las ecuaciones no son una ley de la física. Con definiciones típicas, ¿las ecuaciones no son perfectamente equivalentes a la segunda ley de Newton, que es inequívocamente una ley? No queriendo entrar en un debate sobre la definición de "ley física", pero algunas aclaraciones aquí podrían ser útiles.
Por supuesto, como dijiste, la definición misma de "ley física" está en debate, pero siguiendo el artículo wiki que vinculé, dice "Las leyes físicas son típicamente conclusiones basadas en experimentos y observaciones científicas repetidas durante muchos años y que tienen sean aceptados universalmente dentro de la comunidad científica". Las ecuaciones EL son un formalismo matemático, específicamente el PDE que resuelves para extremizar una acción. El Principio de Acción no es una ley, pero es un principio teórico que produce modelos muy útiles, similares a otros principios, es decir, el principio de relatividad. esta ayuda?
Entonces, para llevar el punto a casa, las leyes de los movimientos de Newton se verifican empíricamente, mientras que las ecuaciones de EL son un método para derivar esas leyes de los movimientos. Las Leyes de Newton se pueden tomar como axiomas, o se pueden derivar, pero las llamamos "leyes" porque son empíricas.

Tu pregunta: '' ¿Por qué la ecuación de Lagrange no es una trivialidad? ¿Qué está mal con mi cálculo? ''.

Primero algo de notación. Usando la notación inequívoca de SICM , las ecuaciones de Lagrange son:

(dónde D es la derivada total (corresponde a la derivada temporal), y Γ [ q ] = ( q , D q , . . . ) es el funcional que proporciona el camino y su(s) derivado(s).)

(Si se pregunta cuál es el problema con la notación tradicional, le recomiendo leer el prefacio de SICM que aborda este tema, pero básicamente se trata de confusiones de las que trata esta pregunta).

Intentar reescribir su cálculo utilizando la notación inequívoca de SICM revela inmediatamente algunos problemas:

Imposible conmutar simplemente derivados: Ninguno

D ( ( 2 L ) Γ [ q ] ) 2 ( ( D L ) Γ [ q ] )
ni
D ( ( 2 L ) Γ [ q ] ) 2 D ( L Γ [ q ] )
ningún sentido.

Imposible cancelar puntos:

2 D ( L Γ [ q ] ) 1 ( L Γ [ q ] )
tanto la izquierda como la derecha parecen bastante absurdas.

Entonces tienes que hacer

1 ( L Γ [ q ] ) = ( 1 L ) Γ [ q ]
para reconstruir una expresión sana.

Por lo tanto, no se garantiza ningún paso en su prueba.

Esta notación parece un poco confusa. No sugiere las variables explícitamente (1 y 2 podrían ser cualquier cosa). ¿Es la ∘ composición funcional? ¿El Γ [ q ] representan un producto interno? Por lo que puedo decir, su principal ventaja es la facilidad de uso con un lenguaje de programación en particular, pero puede ser un poco desconocido. También existe la posibilidad de confusión con los símbolos de Christoffel o la función gamma. ¿Podría explicarlo un poco más completamente en su respuesta?
@ Obie2.0, recomiendo el prefacio de SICM para explicar el fundamento de la notación diferente, pero intentaré explicarlo un poco mejor en mi respuesta.
+1, ¡esta notación lo hace mucho mejor!

No se trata de "lo que está mal", sino de cómo podría averiguar qué está mal (o al menos encontrar algo que está mal en su intento de prueba). Tome un buen Lagrangiano simple, como ese para una partícula libre en una dimensión: L = metro 2 ( q ˙ ) 2 (dónde q representa la distancia). Y tome algún movimiento que no sea correcto en esa situación física, como una aceleración uniforme q = a t 2 , dónde a es una constante distinta de cero. Desde L , obtienes la ecuación de Euler-Lagrange d d t ( metro q ˙ ) = 0 (porque L / q ˙ = metro q ˙ y L / q = 0 ), es decir, se obtiene la conservación de la cantidad de movimiento. Por otro lado, desde q = a t 2 , usted obtiene d d t ( metro q ˙ ) = metro q ¨ = 2 metro a (asumiendo la masa metro es constante). Entonces se viola la ecuación de Euler-Lagrange. Eso ya muestra que la ecuación de Euler-Lagrange no puede ser "simplemente un hecho matemático que funcione para todas las funciones". Pero puede obtener más información conectando este particular L y este en particular q ( t ) en su intento de prueba, para ver exactamente cuál de sus ecuaciones en esa prueba falla.

¡Hola Andreas! ¿No sería más adecuado como comentario? No estoy del todo seguro, solo una sugerencia.
@DvijMankad Estoy tan de acuerdo contigo que comencé a escribir esto como un comentario, pero creo que comentar requiere haber ganado 100 de reputación en este sitio (no por haber estado activo en otros sitios de stackexchange). Entonces, si alguien con la autoridad para hacerlo mueve esto a un comentario, no me importará en absoluto.
¡Ah, claro! No creo que eso se pueda hacer. Creo que puede funcionar perfectamente como una "respuesta complementaria", ya que el cuerpo del texto menciona claramente lo que se propone hacer. ¡Bienvenido a Physics.SE! :-)

¡Esa es una secuencia interesante de manipulaciones simbólicas!

Es debido a la falta de rigor que es fácil caer en estas trampas y, por lo general, los textos de física no explican dónde están, por qué y cómo evitarlas. Es una habilidad que uno adquiere al resolver problemas, repasar la teoría y leer.

Problemas similares están asociados con la integral de trayectoria que no tiene una definición rigurosa. Sin embargo, el cálculo variacional puede hacerse riguroso. Sin embargo, esto es difícil. Por lo general, no se aborda en un curso de matemáticas de pregrado donde definirán rigurosamente el cálculo para una variable real, para una variable compleja y muchas variables reales, ya sea cálculo en una variedad o, más típicamente, cálculo de múltiples variables, que es cálculo en un ( espacio vectorial de dimensión finita).

Para hacer las matemáticas de este riguroso se requiere un aparato de haces de chorro. Puede encontrar una exposición de Saunders Jet Bundles y Michors Natural Operations . Se necesita bastante desarrollo.

N. Steinle ya dio una gran respuesta a la pregunta.

¿Por qué es esta una ley fundamental de la física y no una simple trivialidad de CUALQUIER función L?

pero me gustaría señalar un dato adicional con respecto a la parte

.. parece sugerir que la Ecuación de Lagrange es simplemente un hecho matemático que funciona para cada función.

Si bien las ecuaciones de Lagrange matemáticamente solo describen una función/proceso que es un valor extremo de algún Lagrangiano (o también alguna energía o potencial de acción), la parte importante es que lo contrario no es tan simple.

Parece ser una "ley fundamental de la física" que muchos procesos que observamos en la naturaleza incluso tienen un Lagrangiano, un potencial de energía. En realidad, esto no es trivial, no todas las funciones multidimensionales tienen ese potencial y es una declaración sobre la simetría de estos procesos.

Tienes algunos párrafos duplicados allí...