Pregunta sobre la laguna aparente en el principio de acción mínima: condición de contorno frente a condición inicial

En el formalismo lagrangiano, dados dos puntos ( X 1 , t 1 ) y ( X 2 , t 2 ) , nos preguntamos qué caminos X ( t ) hacer la acción S = t 1 t 2 L   d t estacionario y satisface la condición de frontera X ( t 1 ) = X 1 ,   X ( t 2 ) = X 2 . Esta pregunta es equivalente a resolver la ecuación de Euler-Lagrange

d d t L X ˙ = L q
con condición de frontera X ( t 1 ) = X 1 ,   X ( t 2 ) = X 2 .

Mi pregunta es por qué estamos autorizados a usar la ecuación de Euler-Lagrange para resolver el problema de la condición inicial X ( t 1 ) = X 1 ,   X ˙ ( t 1 ) = v 1 .

Parece que estos son dos problemas diferentes. Un problema es encontrar un camino que satisfaga la condición de frontera X ( t 1 ) = X 1 ,   X ( t 2 ) = X 2 y hacer estacionaria la acción.

El otro problema es encontrar un camino con condición inicial. X ( t 1 ) = X 1 ,   X ˙ ( t 1 ) = v 1 y aun no se como poner otros requisitos tal que su ecuacion de movimiento sea la ecuacion de Euler-Lagrange.

¿Cómo puedes probar que estos dos problemas son equivalentes si puedes aclarar el segundo problema? O tal vez es un axioma que requerimos que el problema de la condición inicial se resuelva mediante la ecuación de Euler-Lagrange. Estoy confundido acerca de la lógica del formalismo lagrangiano.

Respondí una pregunta similar aquí , explicando cómo esto no es un problema en la práctica. También hice una pregunta aquí sobre qué tan mal puede llegar a ser la laguna (¡bastante mal!).
¿ Por qué estamos autorizados a utilizar esta ecuación? No necesita autorización para usar una ecuación.

Respuestas (3)

De hecho, el problema de las condiciones de contorno, en términos generales, no está bien planteado.

Hay condiciones de frontera que no admiten curvas o que admiten muchas curvas, satisfaciendo tanto estas condiciones como las ecuaciones de Euler-Lagrange.

Ejemplos.

(1) Piense en una partícula restringida a permanecer en una esfera lisa donde puede moverse libremente. Si asigna los polos norte y sur de la esfera como condiciones de contorno, obtiene infinitas soluciones ya que el movimiento siempre describe una geodésica.

(2) De manera similar, si elimina una bola abierta en R 3 no tiene soluciones cuando asigna condiciones de contorno en los lados opuestos de la pelota para una partícula libre en R 3 .

Si L es cuadrática con respecto a la q ˙ variables y esta forma cuadrática está estrictamente definida positivamente , como es el caso de los sistemas de partículas clásicas (que también satisfacen las restricciones holonómicas ideales), el problema con las condiciones iniciales siempre está bien planteado siempre que L es suficientemente regular. Hay exactamente una solución máxima que satisface tanto las ecuaciones de Euler-Lagrange como las condiciones iniciales.

Con estas hipótesis, el problema de las condiciones de contorno también está bien planteado con la condición adicional de que las dos condiciones de contorno estén lo suficientemente cerca una de la otra (esto es evidente en los dos ejemplos que presenté anteriormente).

Por estas razones, un punto de vista más seguro (con mentalidad matemática) supone que el principio de variación determina la ecuación de movimiento, pero no las soluciones en sí.

Gracias. Entonces, lo que quiere decir es que la ecuación EL con condición de contorno a veces está mal definida. Pero la ecuación EL con la condición inicial está mayormente bien definida. Dada esta motivación, requerimos que la ecuación de movimiento sea la ecuación EL. Y esto es una especie de axioma en el formalismo lagrangiano.
No creo que tu "punto de vista más seguro" esté justificado. Todo este "espíritu" negativo en la interpretación de estas cosas es en gran parte irracional. Cuando algunas leyes de la física se formulan en términos de la acción -y a menudo lo son en la práctica- y la solución al principio de mínima acción dice que no hay soluciones o que hay muchas soluciones, entonces es una idea correcta e importante que significa algo y deberíamos tomárnoslo muy en serio, independientemente del prejuicio (¡ingenuo!) de que siempre tiene que haber una solución única.
Por ejemplo, en la integral de trayectoria euclidiana en QFT (utilizando el principio de acción), se pueden encontrar numerosas soluciones incluso con las condiciones de contorno dadas, los instantones. Eso no significa que algo esté mal y debamos descartar estas configuraciones o la teoría. Estos instantes (a pesar de que son solo "mínimos locales" de la acción) son genuinos y contribuyen a las amplitudes de probabilidad, y permiten algunos procesos que de otro modo estarían prohibidos.
Estimado Lubos, mi punto de vista es completamente matemático (respecto al buen planteo del problema), estoy completamente de acuerdo contigo en cuanto a la interpretación física y el uso del principio variacional por parte de los físicos...
Quiero hacer una pregunta: ¿cuál es la definición de que las condiciones de contorno son lo suficientemente cercanas entre sí? Y cuál es la definición de L es regular. Puede decirme directamente la referencia si cree que no es conveniente. Gracias.
En cuanto a la regularidad, basta con que L ( t , q , q ˙ ) es C 2 conjuntamente en todas las variables. Una afirmación más precisa es que, al reducir las ecuaciones EL en forma normal , el lado derecho debe ser conjuntamente continuo y conjuntamente localmente Lipschitz en la variable ( q , q ˙ ) .
Con respecto a la otra pregunta, la declaración se puede encontrar en el libro de texto de Arnold. Nunca vi una prueba de este hecho (¡y Arnold no citó referencias!) excepto en el caso de un Lagrangiano cuadrático estrictamente definido positivamente h q a h k ( q ) q ˙ h q ˙ k donde el problema es el mismo que el relativo a la existencia de vecindades geodésicamente convexas para la métrica a h k , que está bien estudiado en la literatura.

El problema es que la física clásica subyacente está determinada por ecuaciones de movimiento (EOM) (es decir, la segunda ley de Newton), que son comunes para problemas de valor inicial (IVP) y problemas de valor límite (BVP). Para BVP, los EOM a menudo se pueden formular alternativamente como ecuaciones de Euler-Lagrange (EL) de un principio de acción estacionario . El último enfoque nunca funciona para IVP, porque uno no tiene las condiciones de contorno correctas para deducir ecuaciones EL a través de la integración por partes. Consulte también esta publicación relacionada con Phys.SE y los enlaces que contiene.

En esta respuesta quiero discutir el hábito de distinguir entre 'problema de valor inicial' y 'problema de valor límite'. Esta discusión será para el contexto de la mecánica clásica. Espero que el razonamiento se generalice a otros campos de la física.

Primero discutiré el tema inicial/límite y, posteriormente, cómo esa discusión se relaciona con la ecuación de Euler-Lagrange.

Esta respuesta está inspirada en una publicación de blog de Chad Orzel .
(Al final de esta respuesta, cito el comentario clave de Chad Orzel).


Para completar, comienzo con el caso trivial de un objeto que se mueve a una velocidad uniforme, con un grado espacial de libertad:

Problema de valor inicial:
Un tren se mueve a X / t Kilómetros por hora. Cuanto se tarda en llegar a un destino X kilómetros de distancia?

Problema de valor en la frontera:
un tren viaja a una estación de tren X kilómetros de distancia. ¿A qué velocidad debe viajar el tren de manera que llegue a su destino después de t ¿horas?

Tenemos:
Cuando el problema se establece como un problema de valor inicial, lo resolvemos por medio de la extrapolación , cuando el problema se establece como un problema de valor límite, lo resolvemos por medio de la interpolación . La '-polación' de 'extrapolación' e 'interpolación' está relacionada con el verbo 'pulir'; Estás obteniendo un resultado suave.

La diferencia entre plantear un problema como un problema de valor inicial o un problema de valor límite es que el orden de las operaciones para resolver el problema es diferente, eso es todo.


Para el siguiente nivel permitimos una aceleración uniforme conocida y dos grados de libertad espacial.

Tienes un cañón que puede disparar proyectiles. El disparo de un proyectil se produce desde una superficie nivelada, de modo que el proyectil que impacta contra el suelo está a la misma altura que cuando se disparó. Suponga que la gravedad estándar de la Tierra.

Problema de valor inicial:
dada la velocidad de la tobera y el ángulo del cañón con respecto a la horizontal, ¿cuál es la distancia horizontal que recorrerá el proyectil y cuál será la duración del vuelo?

Problema de valores en la frontera:
¿Cuál debe ser la componente de velocidad horizontal y cuál debe ser la componente de velocidad vertical, de modo que la distancia horizontal recorrida sea x metros y la duración del vuelo sea t segundos?

El punto es:
Al igual que en el caso más simple de velocidad uniforme: la única diferencia entre plantear el problema como un problema de valor inicial o un problema de valor límite es el orden de las operaciones necesarias para resolver el problema.



La distinción entre 'problema de valor inicial' y 'problema de valor límite' se reduce a la distinción entre extrapolación e interpolación , y esa distinción es discutible.

El factor común de la interpolación y la extrapolación es que aseguras continuidad, suavidad. Es la condición de mantener la continuidad lo que hace que funcione.

En particular: para una ecuación diferencial, la distinción entre interpolación y extrapolación es discutible. (En ambos casos, depende de asegurarse de que se satisfaga la continuidad).



El proceso de derivación de la ecuación de Euler-Lagrange

El proceso de derivación de la ecuación de Euler-Lagrange elimina todos los elementos que son innecesarios.

Repito con otras palabras:
en el curso de derivar la ecuación de Euler-Lagrange se eliminan varios elementos. Los elementos que se eliminan son superfluos en lo que respecta a la solución del problema de física.

(De aquí en adelante abreviaré la ecuación de Euler-Lagrange a: EL-eq.)

Cuando comienzas a derivar el EL-eq. las condiciones de contorno se tratan como variables en el sentido de que las condiciones de contorno no se expresan como valores numéricos; las condiciones de contorno se dejan sin especificar. Al permitir que las condiciones de contorno sean variables, está obteniendo un resultado muy general. Lo que obtiene no está ligado a ninguna condición de contorno específica, y lo que hace es que se difiere la aplicación de las condiciones de contorno .

En el curso de derivar el EL-eq. introduces una forma de representar la variación. (La mayoría de las veces un símbolo como ϵ se utiliza para manipular la variación.) En la etapa final de derivar el EL-eq. se elimina la variación . En cierto sentido, la variación es como un catalizador; está involucrado en la derivación, pero no está presente en el resultado final.

Lo que también se elimina: al comienzo de derivar el EL-eq. se especifica una integración. En la etapa final se elimina esa integración. No se puede no eliminar esa integración. La única manera de derivar el EL-eq. en absoluto es seguir adelante y eliminar la integración .



Tenemos que la ecuación de Euler-Lagrange es una ecuación diferencial.

Como sabemos: una ecuación diferencial es una entidad matemática que describe inherentemente una propiedad local . Por el contrario: la integración es la evaluación de una propiedad global .

El hecho de que la ecuación de Euler-Lagrange sea una ecuación diferencial es precisamente lo que la hace tan poderosa.

La derivación de la ecuación de Euler-Lagrange se establece de tal manera que las condiciones de contorno se tratan como variables. Lo que eso hace es diferir la aplicación de las condiciones de contorno .

El poder de la ecuación de Euler-Lagrange es que es una ecuación diferencial; La distinción entre el problema del valor límite y el problema del valor inicial es discutible.


Ver también:
Una respuesta mía de octubre de 2021 con una discusión sobre la acción estacionaria de Hamilton









Acerca de esa publicación de blog de Chad Orzel:

Chad Orzel plantea la pregunta:

¿Es [...] la interpretación teleológica de los principios de acción mínima un reflejo exacto de la física real?

Chad Orzel señala:

[...] equivale a especificar una posición inicial y una posición final y sorprenderse de que el camino esté determinado, pero si en cambio especificaste una posición inicial y una velocidad inicial, el camino es igualmente inevitable, pero de alguna manera eso se siente menos mágico.