¿Por qué solo hay derivadas de primer orden en el Lagrangiano?

¿Por qué el lagrangiano es una función de la posición y la velocidad (posiblemente también del tiempo) y por qué se excluyen las dependencias de derivadas de orden superior (aceleración, tirón,...)?

¿Hay una buena razón para esto o es simplemente "porque funciona".

La pregunta es mucho más específica que el título, así que quiero señalar que una explicación exitosa de lo que se afirma en la pregunta no implica la verdad de la afirmación en el título. Las derivadas superiores son a veces importantes en física. Los ingenieros que diseñan árboles de levas trabajan muy duro para minimizar el "tirón" j = d 3 X / d t 3 , porque un tirón alto daña el seguidor de leva. La fuerza de reacción radiativa de Lorentz-Dirac sobre una partícula cargada es proporcional a la sacudida. El hilo común es que solo una fuerza cambiante puede causar la radiación de ondas mecánicas o electromagnéticas.
Para la derivación de ecuaciones de Euler-Lagrange (EL) de orden superior para Lagrangianos de orden superior, consulte esta publicación de Phys.SE.
Está algo implícito en la pregunta, pero me gustaría mencionarlo de todos modos: solo considera derivados con respecto al tiempo. Sin embargo, las derivadas de orden superior con respecto a la variable espacial X no son un problema en la mecánica clásica. Por ejemplo, el lagrangiano que da la ecuación de Korteweg-de Vries tiene X 2 ϕ dependencia. Consulte en.wikipedia.org/wiki/Korteweg-de_Vries_equation para obtener más detalles.
¿No es en absoluto curioso que nuestras ecuaciones de movimiento y la ecuación geodésica sean ambas de segundo orden? Uno podría ver la segunda ley libre (F=0) geométricamente como una expresión de la ecuación geodésica (en coordenadas de símbolos de Christoffel que se desvanecen), y la ecuación F=/=0 como una perturbación de la misma. Esto lo explicaría, ¿no? Después de todo, también, el lagrangiano libre puede verse exactamente como lo que produce geodésicas sobre Euler-Lagrange. Si todo es una perturbación del movimiento libre... agitar la mano.

Respuestas (7)

Reproduzco una entrada de blog que escribí hace algún tiempo:

Tendemos a no utilizar teorías de derivadas superiores. Resulta que hay una muy buena razón para esto, pero esa razón rara vez se discute en los libros de texto. Tomaremos, por concreción, L ( q , q ˙ , q ¨ ) , un lagrangiano que depende de la 2ª derivada de manera esencial. Dependencias inesenciales son términos tales como q q ¨ que pueden integrarse parcialmente para dar q ˙ 2 . Matemáticamente, esto se expresa a través de la necesidad de poder invertir la expresión

PAGS 2 = L ( q , q ˙ , q ¨ ) q ¨ ,
y obtener un formulario cerrado para q ¨ ( q , q ˙ , PAGS 2 ) . Tenga en cuenta que normalmente también requerimos una declaración similar para q ˙ ( q , pags ) , y la falla a este respecto es una señal de tener un sistema restringido, posiblemente con grados de libertad de calibre.

En cualquier caso, la no degeneración conduce a las ecuaciones de Euler-Lagrange de la forma habitual:

L q d d t L q ˙ + d 2 d t 2 L q ¨ = 0.
Este es entonces el cuarto orden en t , por lo que requieren cuatro condiciones iniciales, tales como q , q ˙ , q ¨ , q ( 3 ) . Esto es el doble de lo habitual, por lo que podemos obtener un nuevo par de variables conjugadas cuando pasamos a un formalismo hamiltoniano. Seguimos los pasos de Ostrogradski, y elegimos nuestras variables canónicas como q 1 = q , q 2 = q ˙ , lo que lleva a
PAGS 1 = L q ˙ d d t L q ¨ , PAGS 2 = L q ¨ .
Tenga en cuenta que la no degeneración permite q ¨ expresarse en términos de q 1 , q 2 y PAGS 2 a través de la segunda ecuación, y la primera solo es necesaria para definir q ( 3 ) .

Luego podemos proceder de la manera habitual y encontrar el hamiltoniano a través de una transformación de Legendre:

H = i PAGS i q ˙ i L = PAGS 1 q 2 + PAGS 2 q ¨ ( q 1 , q 2 , PAGS 2 ) L ( q 1 , q 2 , q ¨ ) .
Nuevamente, como siempre, podemos tomar la derivada temporal del hamiltoniano para encontrar que es independiente del tiempo si el lagrangiano no depende explícitamente del tiempo y, por lo tanto, puede identificarse como la energía del sistema.

Sin embargo, ahora tenemos un problema: H sólo tiene una dependencia lineal de PAGS 1 , por lo que puede ser arbitrariamente negativo. En un sistema que interactúa, esto significa que podemos excitar los modos de energía positiva transfiriendo energía de los modos de energía negativa y, al hacerlo, aumentaríamos la entropía: simplemente habría más partículas y, por lo tanto, sería necesario colocarlas en algún lugar. Por lo tanto, tal sistema nunca podría alcanzar el equilibrio, explotando instantáneamente en una orgía de creación de partículas. De hecho, este problema es completamente general y se aplica a derivados aún más altos de manera similar.

Buena respuesta, +1. Sin embargo, me deja algo insatisfecho. El párrafo final asume que esto es QFT, y q es un campo, pero ese es un contexto muy estrecho. No vemos teorías de derivadas superiores que describan ningún aspecto de la física. E incluso en QFT, ¿qué pasa con una imagen del mar de Dirac, donde todas las energías negativas están llenas?
Excelente respuesta... con respecto a la "orgía de creación de partículas"... ¿no es ese un aspecto del big bang? ¿Podemos tener una teoría de orden superior inestable que se estabilice en una teoría efectiva de la forma habitual de primer orden, ya que crea un grupo suficientemente grande de partículas que interactúan?
Publicación de blog original del autor: tcm.phy.cam.ac.uk/~gz218/2010/01/…
¿Por qué la explicación no puede ser simplemente que la estabilidad sólo se logra en los puntos extremos y de silla del potencial, es decir, dondequiera que su segunda derivada sea cero? Por lo tanto, cualquier término de orden superior es irrelevante. ¿Estoy simplificando demasiado las cosas?

Excelente pregunta, y para la que nunca he encontrado una respuesta completamente satisfactoria. Pero considere esto: en la mecánica clásica elemental, una de las leyes fundamentales es la segunda ley de Newton, F = metro a , que relaciona la fuerza sobre un objeto con la aceleración del objeto. Ahora, la mayoría de las fuerzas son ejercidas por un objeto en particular sobre otro objeto en particular, y el valor de la fuerza depende solo de las posiciones de los objetos fuente y "objetivo". En conjunción con la segunda ley de Newton, esto significa que, en un sistema clásico con norte objetos, cada uno obedece a una ecuación de la forma

X ¨ i = F ( { X j | j 1 , , norte } )

dónde F es alguna función vectorial. El punto de esta ecuación es que, si tienes las posiciones de todos los objetos, puedes calcular las aceleraciones de todos los objetos.

Al tomar la derivada de esa ecuación, obtienes

X i = F ( { X j } ) { X ˙ j }

(Me estoy perdiendo bastante con la notación aquí; p) Esto le permite calcular el tirón (tercera derivada) usando las posiciones y velocidades. Y puede repetir este procedimiento para obtener una fórmula (al menos en un sentido abstracto) para cualquier derivada superior. Para decirlo en términos simples, dado que la segunda ley de Newton relaciona funciones que están separadas por dos órdenes de derivadas, solo necesita las derivadas 0 y 1, la posición y la velocidad, para "arrancar" el proceso, después de lo cual puede calcular cualquier derivada superior que desee. quiere, y de eso cualquier cantidad física. Esto es análogo (y de hecho está estrechamente relacionado con) el hecho de que para resolver una ecuación diferencial de segundo orden, solo necesita dos condiciones iniciales, una para el valor de la función y otra para su derivada.

La historia se vuelve más complicada en otras ramas de la física, pero aun así, si observas la mayoría de ellas, encontrarás que la ecuación de evolución fundamental relaciona el valor de alguna función con su primera y segunda derivada, pero no más altas. Por ejemplo, en mecánica cuántica tienes la ecuación de Schrödinger,

i Ψ t = 2 2 metro 2 Ψ X 2 + tu ( X ) Ψ

o en la teoría cuántica de campos, la ecuación de Klein-Gordon,

2 ϕ t 2 + 2 ϕ X 2 metro 2 ϕ = 0

y otras, o las ecuaciones de Maxwell (equivalentemente, la ecuación de onda que se puede derivar de ellas) en el electromagnetismo clásico. En cada caso, puede usar un argumento similar para al menos motivar el hecho de que solo la posición o su campo equivalente y su primera derivada son suficientes para especificar el estado completo del sistema.

Por supuesto, aún puede preguntarse por qué las ecuaciones que describen el universo relacionan funciones que están separadas por solo dos derivadas, en lugar de tres o cuatro. Esa parte es un misterio, pero cae en el ámbito de la filosofía en lugar de la física.

Buena respuesta +1. En cuanto a por qué tenemos solo dos derivadas, o más generalmente, por qué los lagrangianos tienen la forma que tienen, eche un vistazo a este artículo de B. Roy Frieden. Durante mucho tiempo ha estado tratando de enfatizar el papel de la información en la física. Solo recientemente la corriente principal ha comenzado a apreciar este hecho. No se desanime por los títulos de algunos de los trabajos de Frieden. La grandiosidad es una ofensa perdonable, especialmente para los trabajadores en un territorio tan implacable :)
súper respuesta Re. física.stackexchange.com/q/4102 . ¿Hay alguna referencia para "Para ponerlo en términos simples, dado que la segunda ley de Newton relaciona funciones que están separadas por dos órdenes de derivadas, solo necesita las derivadas 0 y 1, posición y velocidad, para "arrancar" el proceso ", un libro o papel?

Hay implicaciones para la causalidad cuando una ecuación de movimiento contiene derivadas superiores a la segunda de los campos, la radiación EM de cuerpos cargados supera la derivada de la aceleración

No sé los detalles de POR QUÉ, pero este libro debería dar más detalles: (Relaciones de causalidad y dispersión) http://books.google.com/books?id=QDzHqxE4anEC&lpg=PP1&dq=causality%20dispersion%20relations&pg=PP1#v =unapágina&q&f=falso

+1 Creo que este tema está muy subestimado (al menos en mi experiencia) y es extremadamente interesante.

Hay formulaciones que involucran derivados de orden superior, sin embargo, hizo una caracterización justa.

Creo que una regla general sería comenzar a buscar el Lagrangiano más simple que se te ocurra. En el caso general, un buen lagragiano debe obedecer a la homogeneidad del espacio, el tiempo y la isotropía del espacio, lo que significa que no puede contener explícitamente la posición, el tiempo y la velocidad. v , respectivamente. Entonces, la posibilidad permitida más simple es tener un Lagrangiano con una velocidad al cuadrado. Dado que no necesitamos buscar que se cumplan más condiciones, no es necesario agregar términos que involucren derivadas superiores o combinaciones de otros términos.

Puede ver este procedimiento en funcionamiento (en realidad, bastantes veces) en Landau & Lifshitz, The Classical Theory of Fields.

Si tienes razón, entonces mi respuesta es incorrecta. ¿Podría proporcionar un ejemplo de un Lagrangiano que involucre derivadas superiores?
@gabgoh: Sin buscar demasiado, encontré esto como ejemplo arxiv.org/abs/1012.2969 .
Gracias por la respuesta. Desafortunadamente, el documento parece involucrar la teoría de calibre, algo con lo que no estoy muy familiarizado. Esperaba un ejemplo simple de mecánica clásica que involucre un Lagrangiano de orden superior. ¿O tal vez necesito aventurarme más allá de la mecánica para encontrar una solución?
@gabgoh: No creo que haya una formulación convencional que involucre a Lagrangian de orden superior de la mecánica clásica (aunque podría estar equivocado). Tal vez la publicación escrita por @lurscher pueda dar ese ejemplo.

Bueno, la física habitual en la mecánica clásica se formula en términos de ecuaciones diferenciales de segundo orden. Si está familiarizado con el proceso de derivación de ecuaciones de Euler-Lagrange a partir del Lagrangiano, entonces debería ser natural que el término cinético sea proporcional a ( t X ) 2 para reproducir eso.

Si hubiera considerado lagrangianos más generales (que ciertamente es libre de hacerlo), obtendría ecuaciones de movimientos arbitrariamente complicadas, pero estas no corresponderían a nada físico. Sin embargo, algunas de esas ecuaciones podrían describir algunos objetos matemáticos (porque el formalismo lagrangiano y el cálculo de variaciones no son inherentes solo a la física sino también a muchas otras disciplinas matemáticas).

Esta pregunta en realidad necesita una respuesta de 2 pasos:

  1. ¿Por qué el lagrangiano solo tiene derivadas de primer orden?:

El lagrangiano se ha definido de tal manera que el problema a resolver produciría una derivada de segundo orden con respecto al tiempo cuando se produzca la ecuación de Euler-Lagrange. Incluye una derivación implícita del impulso (observe la derivada del tiempo después del signo menos en L q d d t L q ˙ = 0 ) que a su vez, es una derivada de primer orden de posición. Significa que, en realidad, la aceleración se tiene en cuenta cuando se configura el problema completo. Uno puede verificarlo simplemente comprobando que para la mayoría de los casos la ecuación de Euler-Lagrange resulta ser L q metro q ¨ = 0 y si uno define L q = F se convierte en la segunda ley de Newton. Habiendo dicho eso, tenemos que pasar al siguiente paso, que es,

  1. ¿Por qué no es necesario el jerk (o cualquier derivado mayor del tiempo)?:

Esta pregunta ya ha sido respondida (incluida una mía) aquí ¿Por qué? F = metro a y no F = metro a ˙ . La respuesta corta es: "... la derivada de segundo orden es todo lo que se necesita para diferenciar los estados de movimiento naturales de los estados de movimiento afectados " .

Si asumimos, digamos, una segunda derivada en el Lagrangiano, las ecuaciones de Euler-Lagrange que minimizan la acción

A [ q ] = X 1 X 2 L ( X , q , q , q ) d X

sería

L q d d t L q + d 2 d t 2 L q = 0

Esta es una ecuación diferencial de cuarto orden. Sin embargo, este no puede ser el caso ya que sabemos que q = F / metro , es decir, la aceleración está determinada por la Fuerza, que está "fuera" de las condiciones iniciales. En un campo de fuerza gravitacional, por ejemplo, ya sabes, a piori, las fuerzas en cada punto del sistema y, por lo tanto, la aceleración en cada punto del sistema ya se conoce. Una DE de cuarto orden conduciría a una inconsistencia interna.

Supongo que la pregunta más profunda es por qué F = metro q , no F = metro q o F = metro q . No pretenderé saber la respuesta a esto, pero sospecho que podría haber una.