Confusión sobre el principio de mínima acción en Landau & Lifshitz "The Classical Theory of Fields"

Editar: el título anterior realmente no preguntaba lo mismo que la pregunta (lo siento), así que lo cambié. Para aclarar, entiendo que la acción no siempre es mínima. Mis preguntas están en los puntos 1. y 2. a continuación.


Entiendo que "principio de mínima acción" es algo inapropiado, ya que encontramos que para determinar el camino tomado por un sistema, solo necesitamos imponer la condición de que la acción sea estacionaria, es decir, que d S debería desaparecer a primer orden para pequeñas variaciones de la trayectoria, y esto conduce a las ecuaciones de Euler-Lagrange.

En The Classical Theory of Fields , Landau y Lifshitz analizan la acción relativista de una partícula libre:

Entonces, para una partícula libre, la acción debe tener la forma

S = α a b d s

(...) Es fácil ver eso α debe ser una cantidad positiva para todas las partículas. De hecho, como vimos [anteriormente], a b d s tiene su valor máximo a lo largo de una recta universal; al integrar a lo largo de una línea universal curva, podemos hacer que la integral sea arbitrariamente pequeña. Así la integral a b d s con el signo positivo no puede tener un mínimo; con el signo opuesto claramente tiene un mínimo, a lo largo de la línea recta del mundo.

También hay una nota al pie, abordada un par de párrafos antes, pero que es relevante:

Estrictamente hablando, el principio de acción mínima afirma que la integral S debe ser un mínimo solo para longitudes infinitesimales del camino de integración. Para caminos de longitud arbitraria solo podemos decir que S debe ser un extremo, no necesariamente un mínimo.

Tengo dos preguntas con respecto a esto:

  1. ¿Cómo se formula la condición "la acción debe ser mínima para desplazamientos infinitesimales"? Nunca he oído hablar de eso fuera de los libros de Landau & Lifshitz, y en Mechanics también lo mencionan pero no entran en detalles. ¿Se habla de esto un poco más en alguna parte?

  2. Si para todo el camino la acción solo necesita ser estacionaria, ¿cómo podemos argumentar a favor del signo negativo? Si la acción tuviera que ser un mínimo entonces tendría sentido, pero seguramente el hecho de que d S = 0 no se ve afectado por un signo general?

También es posible proporcionar ejemplos en los que la verdadera ruta de distancia mínima no resuelve el problema de Euler-Lagrange. Tomar como ejemplo, R 2 con el círculo unitario y su interior eliminados, e intente extremar el camino desde ( 2 , 0 ) a ( 2 , 0 )
Para la posteridad, dejo un enlace aquí a una demostración numérica de las dos respuestas principales a continuación (por Qmechanic y auxsvr). Resuelvo el movimiento de un oscilador armónico simple de dos maneras: integrando la EDO de Euler Lagrange (típica) y discretizando la función de acción en sí misma para que pueda minimizarse numéricamente (piense en el descenso de gradiente, aunque usé SQP).
^ Estos producen resultados idénticos cuando la duración de la simulación es menor que el "tiempo característico" que explicó Qmechanic. Más allá de eso, el enfoque de minimización no tiene sentido, lo que indica que la solución física siempre tiene una acción estacionaria pero no siempre una acción mínima, incluso para sistemas muy simples/fundamentales. El punto (conjugado) en el que se rompe la minimización es exactamente el calculado teóricamente en la respuesta de auxsvr.

Respuestas (4)

Tal vez un ejemplo simple esté en orden. Considere un oscilador armónico simple (SHO)

(1) S   =   t i t F d t   L , L   =   metro 2 X ˙ 2 k 2 X 2 ,

con frecuencia característica

(2) 2 π T   =   ω   =   k metro ,

y condiciones de contorno de Dirichlet

(3) X ( t i )   =   X i y X ( t F )   =   X F .

Se puede demostrar que el camino clásico es solo un mínimo para la acción (1) si el período de tiempo

(4) Δ t   :=   t F t i     T 2

es menor que una escala de tiempo característica T 2 del problema. (Si Δ t = T 2 hay un modo cero.) Para Δ t > T 2 el camino clásico ya no es un mínimo para la acción (1), sino solo un punto de silla. Si consideramos cada vez más grande Δ t , un nuevo modo/dirección negativa se desarrolla/aparece cada vez Δ t cruza un múltiplo de T 2 .

Son tales ejemplos que la Ref. 1. tiene en mente cuando dice que el principio de mínima acción es en realidad un principio de acción estacionaria . El fenómeno anterior es bastante general y está relacionado con los puntos conjugados /puntos de inflexión y la teoría de Morse . En la expansión semiclásica de la mecánica cuántica, este comportamiento afecta la corrección metapléctica / índice de Maslov . Véase, por ejemplo, Ref. 2 para más detalles.

Un fenómeno similar tiene lugar en la óptica geométrica , donde es sencillo construir ejemplos de caminos de luz que no minimizan el tiempo, cf. Principio de tiempo mínimo de Fermat.

Referencias:

  1. Landau y Lifshitz, Vol.2, The Classical Theory of Fields, p. 24

  2. W. Dittrich y M. Reuter, Classical and Quantum Dynamics , 1992, Capítulo 3.

Con respecto a la segunda pregunta de OP (v2): en mecánica cuántica, el signo general de la acción S en la trayectoria la integral está ligada a la unitaridad , es decir que el hamiltoniano debe estar acotado por abajo. Para convenciones de signos no estándar, consulte, por ejemplo, esta publicación de Phys.SE.
Consulte también esta publicación Phys.SE relacionada.

Sus preguntas se responden en Cálculo de variaciones , Gelfand, 2000, sección 36.2. Primero necesitamos un teorema:

el funcional S [ X ] = a b L ( t , X , X ˙ ) d t , X ( a ) = A , X ( b ) = B debe satisfacer las siguientes condiciones para tener un mínimo débil para X = X ( t ) :

  1. La curva X ( t ) satisface la ecuación de Euler-Lagrange, es decir, es un extremo,
  2. X ˙ X ˙ L | X ( t ) > 0 ,
  3. El intervalo [ a , b ] no contiene puntos conjugados a a .

La definición de puntos conjugados está en la p.114.

  1. Un ejemplo que ilustra esto es el oscilador armónico,
    metro X ¨ + k X = 0 , X ( 0 ) = 0 , X ˙ ( 0 ) = 1
    con solucion X ( t ) = 1 ω pecado ( ω t ) , ω k metro y acción
    S [ X ] = 1 2 a b metro X ˙ 2 k X 2 d t .
    Puntos ( t = π / ω , X = 0 ) y ( t = 0 , X = 0 ) son conjugados, porque todo extremo a partir de X ( 0 ) = 0 corta la solución antes mencionada en ( π / ω , 0 ) . Las condiciones del teorema anterior para un mínimo se cumplen para 0 a t < π / ω y no para intervalos ampliados.
  2. En la página 161, Gelfand muestra que para una cuerda vibrante con extremos fijos no hay intervalo de tiempo sin un par de puntos conjugados, por lo que no podemos garantizar que la solución de la ecuación de onda minimice la acción en absoluto. Luego, afirma que esta es la razón por la que reemplazamos el principio de mínima acción con el principio de acción estacionaria para los sistemas mecánicos.

Creo que esto podría ser una convención de signos de Landau porque, en principio, podemos establecer:

a b d s = a b d s d pags d pags = a b ± ± η m v d X m d pags d X v d pags d pags

Dado que nos estamos entrometiendo con el signo dentro de la raíz cuadrada en función de si investigamos curvas similares al espacio/tiempo X m ( pags ) , también podemos poner un signo menos delante para indicar que estamos trabajando con un tipo diferente de "longitud" que en el espacio normal. En ese caso realmente obtendríamos un mínimo con el factor α .

Todo este asunto del "mínimo de acción" es más una reliquia histórica de la filosofía natural y es cierto solo para Lagrangianos especiales. Por ejemplo, en lentes gravitacionales (es decir, geodésicas nulas en relatividad), se obtienen múltiples imágenes mediante múltiples caminos extremos de los cuales al menos uno es un máximo (en el caso de múltiples imágenes, para una sola imagen, es un mínimo).

Sin embargo, para investigar prácticamente el mínimo, se puede expandir el Lagrangiano como en la derivación habitual de las ecuaciones de Euler-Lagrange pero a segundo orden en la variación de la trayectoria . d X m . Al primer orden obtienes las ecuaciones de Euler-Lagrange que generalmente debes resolver. Luego, la solución se sustituye en la expansión de segundo orden, lo que hace que el primer orden desaparezca y luego debe investigar el signo de la expresión resultante.

Creo que es más que una reliquia histórica porque fijó el signo de la masa en la partícula libre no relativista Lagrangiana, fijando así los signos de todo lo que viene después.
Cualquier tipo de signo, o de hecho, cualquier tipo de constante , ya sea positiva, negativa o compleja, multiplicando el Lagrangiano, no cambia la física real que predice. Simplemente escriba las ecuaciones de Euler-Lagrange: la constante siempre se puede cancelar. Como ya mencioné para la lente, es posible que no haya estrictamente un solo tipo de extremo para un lagrangiano determinado, por lo que tratar de establecer la convención en un mínimo o un máximo no tiene sentido.

Soy consciente de que esta pregunta se envió en 2014, por lo que es muy probable que en los años intermedios haya encontrado la respuesta.

Pero en caso de que envíe esta respuesta de todos modos.

El trasfondo de la respuesta que envío aquí es la exposición de la acción estacionaria de Hamilton que presenté en physics.SE en octubre de 2021.

En esta respuesta discutiré en qué casos la verdadera trayectoria corresponde a un mínimo de la acción de Hamilton y en qué casos la verdadera trayectoria corresponde a un máximo de la acción de Hamilton. También discutiré qué caso es el caso crítico que está en la cúspide del cambio de mínimo a máximo.


Discutiré el caso simplificado de movimiento en una dimensión espacial; la generalización a 3 dimensiones espaciales es sencilla.

Discutiré en secuencia los siguientes tres casos:

  • el movimiento está sujeto a una fuerza uniforme, por lo tanto, el potencial aumenta linealmente con el desplazamiento
  • el movimiento está sujeto a una fuerza que aumenta linealmente con el desplazamiento, por lo tanto, el potencial aumenta con el cuadrado del desplazamiento
  • el movimiento está sujeto a una fuerza que aumenta cuadráticamente con el desplazamiento, por lo tanto, el potencial aumenta con el cubo del desplazamiento

La variación de la trayectoria de prueba es variación de la coordenada de posición.

A medida que se aplica la variación de la trayectoria de prueba, la evaluación compara la respuesta de la energía cinética con la respuesta de la energía potencial.

La tasa de cambio de la trayectoria de prueba se propaga a la velocidad a lo largo de la trayectoria de prueba. Como sabemos: la expresión de la energía cinética proporcional al cuadrado de la velocidad. Por tanto, la respuesta de la energía cinética a la variación es en todos los casos una función cuadrática.


El potencial aumenta linealmente con el desplazamiento

Cuando la energía potencial aumenta linealmente con el desplazamiento tenemos que la respuesta de la energía potencial a la variación de la trayectoria del ensayo es lineal .

Por eso: cuando la energía potencial aumenta linealmente con el desplazamiento, la verdadera trayectoria corresponde a un mínimo de la acción de Hamilton.


El potencial aumenta cuadráticamente con el desplazamiento

Como sabemos: en el caso idealizado de una fuerza que aumenta en proporción exacta al desplazamiento (ley de Hooke perfecta) la solución a la ecuación de movimiento es la oscilación armónica.

Como sabemos: la oscilación armónica idealizada tiene la siguiente propiedad: el período de oscilación es independiente de la amplitud. Expresado de otra manera: dado un potencial cuadrático particular, cada amplitud de oscilación tiene el mismo período de oscilación .

La acción estacionaria de Hamilton reproduce la propiedad de amplitud anterior.

Evalúe un potencial cuadrático en un intervalo de tiempo que sea igual a la mitad de un período de una oscilación completa. Entonces: si el período de oscilación es 2 π segundos, luego evalúe desde t = 0 a t = π En ese caso, con el intervalo de tiempo igual a la mitad de un período, establecer la coordenada de la posición inicial en cero significa que la coordenada de la posición final será cero.

Entonces, la evaluación resulta de la siguiente manera: para cada amplitud de oscilación, la acción de Hamilton se evalúa como cero .

La acción de Hamilton se evalúa como cero porque en el caso de la oscilación armónica, tanto la energía cinética como la energía potencial responden cuadráticamente a la variación de la trayectoria de prueba; las respuestas son iguales.

Resumen:
en el caso de la ley de Hooke, evaluada para un intervalo de tiempo que es la mitad de un período de oscilación (o cualquier múltiplo entero de eso), tenemos que la acción de Hamilton se evalúa a cero para cada amplitud de oscilación.


Es una propiedad fundamental de la oscilación armónica idealizada que el período de oscilación sea independiente de la amplitud. La acción de Hamilton cumple con eso: para cada amplitud de oscilación, la acción de Hamilton se evalúa como cero

Por lo tanto:
Para calcular una amplitud real de oscilación para algún caso específico , se debe proporcionar una condición inicial adicional. Con solo las condiciones de contorno, el problema está subdeterminado.


Aumentos potenciales en proporción al cubo del desplazamiento

Déjame hacer una comparación. En la física del amortiguamiento existe una subdivisión natural en subamortiguamiento, amortiguamiento crítico y sobreamortiguamiento. Los casos de potencial lineal, potencial cuadrático y potencial proporcional al cubo de desplazamiento caen en una subdivisión análoga.

Caso crítico:
Tanto la energía cinética como la energía potencial responden cuadráticamente a la variación de la trayectoria de prueba

Subcrítico:
Siempre que la respuesta de la energía potencial a la variación de la trayectoria de prueba sea de orden inferior al cuadrático, la trayectoria verdadera corresponde a un mínimo de la acción de Hamilton.

Sobrecrítico:
Siempre que la respuesta de la energía potencial a la variación de la trayectoria de prueba sea de orden superior al cuadrático, la trayectoria verdadera corresponde a un máximo de la acción de Hamilton.

Para enfatizar permítanme repetir que:
Hay clases de casos donde la verdadera trayectoria corresponde a un máximo de la acción de Hamilton.


Tenga en cuenta, por ejemplo, que la ecuación de Euler-Lagrange es independiente de si la trayectoria que identifica corresponde a un mínimo o un máximo de la acción de Hamilton. Que la acción de Hamilton sea un mínimo o un máximo no es relevante. La única propiedad relevante es que está identificando el punto donde la acción de Hamilton es estacionaria .



Sin embargo, hay un giro en el caso demasiado crítico.
Si la energía potencial en función de la posición es proporcional al cubo (o mayor), la evaluación de la acción de Hamilton debe realizarse en un intervalo de tiempo suficientemente largo .

Para ver por qué, dibuja en el mismo diagrama una función cuadrática F ( X ) = X 2 y una función cúbica gramo ( X ) = X 3 . Dada la distancia suficiente a lo largo del eje horizontal, la función cúbica siempre superará a la función cuadrática, pero la función cúbica es más lenta al principio.

Así que hay un problema de escala . Por debajo de alguna escala, la función cuadrática es más inclinada que la función cúbica; para que la función cúbica triunfe, la evaluación debe extenderse sobre una escala suficientemente larga.

Debido a ese problema de escala: cuando se reduce a un intervalo de tiempo específico suficientemente estrecho, la acción de Hamilton será mínima, incluso con un potencial superior al cuadrático.

Mi evaluación es que Landau notó este comportamiento en las matemáticas y, posteriormente, decidió afirmarlo como una propiedad, aunque sin dar una explicación. Supongo que si Landau hubiera sabido la explicación, habría dado la explicación.



'Acción estacionaria' versus 'acción mínima'

Como sabemos, en la gran mayoría de los casos prácticos la respuesta de la energía potencial a la variación de la trayectoria del ensayo es de orden inferior al cuadrático. Los dos grandes, la gravedad y la fuerza de Coulomb son leyes de fuerza del cuadrado inverso.

El caso crítico, la oscilación armónica, también es omnipresente, por supuesto. (Por otra parte, es el caso idealizado el que es crítico, y no estoy seguro de si en la mecánica clásica hay casos en los que una oscilación es físicamente la oscilación armónica idealizada ).

Los casos en los que el potencial aumenta con el cubo del desplazamiento (o un orden superior) son raros, pero existen.

El cambio de mínimo a máximo a medida que pasa de subcrítico a sobrecrítico demuestra que, fundamentalmente, el criterio es identificar el punto de acción estacionario .