Cálculo de variaciones: ¿cómo tiene sentido variar la posición y la velocidad de forma independiente?

En el cálculo de variaciones, particularmente en la mecánica lagrangiana, la gente suele decir que variamos la posición y la velocidad de forma independiente. Pero la velocidad es la derivada de la posición, entonces, ¿cómo puedes tratarlas como variables independientes?

¿Podría aclarar un poco, por favor? El cálculo de variaciones en sí mismo es un tema de matemáticas, entonces, ¿qué aplicación particular de física tienes en mente? ¿Quiere decir algo como "¿Tiene sentido aplicar las ecuaciones de Euler-Lagrange al problema de minimizar una acción, dado que hacerlo requiere tratar la posición y la velocidad como variables independientes, cuando físicamente si conoce la posición como un función del tiempo, la velocidad está completamente especificada?
Excelente pregunta sobre el fundamento mismo de todo lo que calculamos. Además - provocando grandes respuestas. Eres muy bienvenido a compartir tus dudas con nosotros @grizzly adam :) Saludos
Me he preocupado por esto durante años, me paró en seco cuando trataba de aprender matemáticas aplicadas y he conocido a matemáticos puros realmente buenos que tenían problemas similares. Una explicación que tiene sentido para mí está en el libro barato "Mecánica clásica: el mínimo teórico" que utiliza un enfoque infinitesimal similar a una escuela, en mi opinión, responde una pregunta que el autor en realidad no plantea. Gracias por publicar esta pregunta.
Le recomiendo que eche un vistazo al libro de Burke Applied Differential Geometry (Cambridge U. Press 1987). Considere que su dedicatoria en las portadas dice esto: " A todos aquellos que, como yo, se han preguntado cómo diablos pueden cambiar q sin cambiar q ˙ . " :)

Respuestas (8)

A diferencia de lo que sugiere su pregunta, no es cierto que la velocidad varíe independientemente de la posición. Una variación de posición q q + d q induce una variación de velocidad t q t q + t ( d q ) como era de esperar.

Lo único que puede parecer extraño es que q y t q son tratadas como variables independientes del Lagrangiano L ( q , t q ) . Pero esto no es sorprendente; después de todo, si pregunta "¿cuál es la energía cinética de una partícula?", entonces no es suficiente saber la posición de la partícula, también debe conocer su velocidad para responder esa pregunta.

Dicho de otra manera, puede elegir la posición y la velocidad de forma independiente como condiciones iniciales , es por eso que la función Lagrangiana las trata como independientes; pero el cálculo de variación no los varía independientemente , una variación en la posición induce una variación adecuada en la velocidad.

Para ser más precisos: no se trata sólo de tener que elegir condiciones iniciales independientes. Las velocidades y posiciones como coordenadas son siempre independientes a menos que estemos en una solución de la ecuación de movimiento. Eso es, v j = q ˙ j sólo en las trayectorias que resuelven las ecuaciones de Euler-Lagrangian. Sobre aquéllas, las variaciones del primero implican variaciones del segundo. En otros lugares no están relacionados.
Por favor explique las primeras líneas. La posición y la velocidad son independientes. Dependen explícitamente sólo del tiempo. Por supuesto, dependen implícitamente unos de otros, pero no explícitamente. No puedes cambiar v simplemente cambiando x solo. Cuando cambias x se entiende que t cambia. Es debido a ese cambio en t que v cambia. Esencialmente, la derivada de parcialidad de v con x es 0, pero la derivada de v con x no es 0. Por eso, creo que no aplicamos ninguna "regla de la cadena" aquí.
@Shashaank la derivada de v con respecto a x es 0.
@Greg Graviton Entonces, de acuerdo con su respuesta, si puedo elegir la aceleración de forma independiente, ¿también se tratará como una variable independiente?
@Teórico En principio, el Lagrangiano también puede depender de la aceleración, por ejemplo, estar representado por una función L ( q , v , a ) dónde q , v , a son variables independientes. Sin embargo, sólo se evalúa en curvas. q ( t ) dónde q q ( t ) , v t q ( t ) y a t 2 q ( t ) .
Estoy algo convencido por la explicación de @gented. Pero aun así no puedo evitar retorcerme las manos de frustración. He ido a través de Goldstein, etc., simplemente pasan por alto esto. Seguramente este salto conceptual del pensamiento merecía una amplia discusión en el texto. Bien, incluso si vamos con lo que dice gented (en otras palabras, q y q d o t son dependientes aunque solo cuando están en el camino de la solución), lo que todavía me molesta es esto: ¿Todavía no tiene que ser consistente? Como en, después de resolver la ruta, normalmente si volvemos sobre nuestros pasos matemáticos, normalmente esperaríamos que se satisfagan todos los pasos. No parece ser el caso aquí.
Por ejemplo, si F = q 1 2 t 3 + q 2 2 t 2 . Suponer q 1 y q 2 son funciones del tiempo (que se desconocen a priori pero se conocen después de resolver el problema). Entonces, ¿es correcto decir que ( F ) ( q 1 ) = 2 q 1 t 3 , como todas las justificaciones hasta ahora quieren hacer creer? Bueno, eso no parece ser correcto si finalmente se encontró que la solución es decir q 1 ( t ) = t . Si sustituimos esto en F , obtenemos F = q 1 5 + q 1 2 q 2 2 , y luego calcular ( F ) ( q 1 ) , que da un valor totalmente diferente. ¿Cómo se explica esto?
@vharihar En este caso, el problema es en realidad con la derivada parcial: ¡no es estable bajo un cambio de variables! Considere por ejemplo gramo ( X , y ) . La derivada parcial gramo / X y = constante es diferente de la derivada parcial gramo / X z = constante dónde z = y X .

La respuesta a su pregunta principal ya está dada: no varía la coordenada y la velocidad de forma independiente. Pero parece que su principal problema es usar las coordenadas y la velocidad como variables independientes.

Permítanme referirme a este gran libro: "Geometría Diferencial Aplicada". Por William L. Burke . La primera línea del libro (donde un autor generalmente dice a quién está dedicado este libro) es esta:

Guillermo Burke

Es cierto que de vez en cuando los estudiantes hacen esta pregunta. Pero los intentos de explicarlo "de arriba hacia abajo" generalmente solo conducen a más y más preguntas. Uno realmente necesita hacer un orden matemático "de abajo hacia arriba" en el tema. Bueno, como sugiere el nombre del libro, la disciplina matemática que uno necesita es la geometría diferencial .

No puedo volver a contar todos los detalles, pero brevemente se ve así:

  • Empiezas con un espacio de configuración METRO de su sistema METRO es una variedad (diferenciable) , y q son las coordenadas en esta variedad.
  • Luego hay un procedimiento específico, que le permite agregar todas las "velocidades" posibles en cada punto dado de METRO . Y llegas al paquete tangente T METRO , que también es una variedad, y ( q , q ˙ ) son diferentes coordenadas en él.
  • Lagrangiana es una función en T METRO .
Yo tengo este libro y traté de leerlo. Pero carece de definiciones claras, y lo encontré más frustrante que esclarecedor. Además, no creo que sea necesario saber geometría diferencial para entender el cálculo de variaciones. Eso es como decir que no puedes entender la aritmética a menos que sepas la teoría de conjuntos.
En primer lugar, como dije, estás mezclando dos puntos diferentes: sobre cálculos variacionales y sobre independencia de velocidades y coordenadas. Segundo: no dije que tienes que leer solo un libro para entender DG.
Creo que para apreciar realmente la mecánica lagrangiana y hamiltoniana es necesario comprender algo de geometría diferencial. Arnold dice en su libro Métodos matemáticos de la mecánica clásica que "la mecánica hamiltoniana no se puede entender sin formas diferenciales". Este libro, por cierto, le enseñará la geometría diferencial que necesita para comenzar, asumiendo solo algunos cálculos.

Teniendo en cuenta lo que escribió Greg Graviton, escribiré la derivación y veré si puedo encontrarle sentido.

S = t 1 t 2 L ( q , q ˙ , t ) d t

donde S es la acción y L el lagrangiano. Variamos el camino y encontramos el extremo de la acción:

d S = t 1 t 2 ( L q d q + L q ˙ d q ˙ ) d t = 0 .

Aquí, q y q ˙ se varían de forma independiente. Pero luego, en el siguiente paso, usamos esta identidad,

d q ˙ = d d t d q .

Y aquí es donde la relación entre q y q ˙ entra en escena. Yo creo que lo que está pasando aquí es que q y q ˙ son tratados inicialmente como independientes, pero luego la identidad elimina la independencia.

d S = t 1 t 2 ( L q d q + L q ˙ d d t d q ) d t = 0

Y luego sigue el resto de la derivación. Integramos el segundo término por partes:

d S = [ L q ˙ d q ] t 1 t 2 + t 1 t 2 ( L q d d t L q ˙ ) d q d t = 0 ,

y la expresión entre paréntesis es cero porque los extremos se mantienen fijos. Y luego podemos sacar la ecuación de Euler-Lagrange:

L q d d t L q ˙ = 0 .

Ahora tiene más sentido para mí. Empiece por tratar las variables como independientes, pero luego elimine la independencia imponiendo una condición durante la derivación.

Creo que eso tiene sentido. Espero que, en general, otros problemas se puedan tratar de la misma manera.

(Copié las ecuaciones anteriores de Mechanics de Landau y Lifshitz).

Bueno, en lugar de decir " q y q ˙ varían de forma independiente", también se podría decir " q y q ˙ son variados (tal vez de forma independiente, tal vez no)" y más tarde nota que la variación d q ˙ es dado por d q ˙ = d d t d q .
La notación de los argumentos. L es algo confuso, en cuyo caso es instructivo considerar el siguiente ejemplo: tomar F ( X , 2 X y ) y variar F ( X + d X , 2 ( X + d X ) y ) = F X d X + F ( 2 X y ) 2 d X . Se podría decir que los argumentos de F varían de forma independiente, pero eso suena raro. En todo caso, es solo que la notación para las derivadas parciales de F es malo; es mucho mejor escribir F ( tu , v ) y ( tu , v ) = ( X , 2 X y ) para obtener d F = F tu d tu + F v d v
... y expresar las variaciones d tu y d v en términos de d X después.
Sí, la notación es confusa. Ese es otro problema.
Landau es un gran físico matemático pero no es conocido como un simple escritor :-)
Ni una palabra de Landau, ni un pensamiento de Lifshitz.
@grizzlyadam así que, al final, no son independientes, pero pueden tratarse tanto porque las matemáticas lo prueban, ¿verdad?

Aquí está mi respuesta, que es básicamente una versión ampliada de la respuesta de Greg Graviton.

La pregunta de por qué uno puede tratar la posición y la velocidad como variables independientes surge en la definición del Lagrangiano L mismo, antes de usar la ecuación de movimiento, y antes de pensar en variar la acción S := t i t F d t   L , y por lo tanto no tiene nada que ver con el cálculo de la variación.

I) Por un lado, consideremos primero el papel del Lagrangiano. Sea dado un instante de tiempo arbitrario pero fijo t 0 [ t i , t F ] . El Lagrangiano (instantáneo) L ( q ( t 0 ) , v ( t 0 ) , t 0 ) es una función tanto de la posición instantánea q ( t 0 ) y la velocidad instantanea v ( t 0 ) en el instante t 0 . Aquí q ( t 0 ) y v ( t 0 ) son variables independientes . Tenga en cuenta que el Lagrangiano (instantáneo) L ( q ( t 0 ) , v ( t 0 ) , t 0 ) no depende del pasado t < t 0 ni el futuro t > t 0 . (Se puede objetar que el perfil de velocidad q ˙ d q d t : [ t i , t F ] R es la derivada del perfil de posición q : [ t i , t F ] R , entonces, ¿cómo puede q ( t 0 ) y v ( t 0 ) ser realmente variables independientes? El punto es que dado que la ecuación de movimiento es de segundo orden, uno todavía tiene derecho a hacer 2 elecciones independientes de condiciones iniciales: 1 posición inicial y 1 velocidad inicial). Podemos repetir este argumento para cualquier otro instante t 0 [ t i , t F ] .

II) Por otro lado, consideremos el cálculo de variación. La acción funcional

(1) S [ q ]   :=   t i t F d t   L ( q ( t ) , q ˙ ( t ) , t )
depende de la ruta completa (quizás virtual) q : [ t i , t F ] R . Aquí la derivada del tiempo q ˙ d q d t depende de la funcion q : [ t i , t F ] R . Extremando la acción funcional

(2) 0   =   d S   =   t i t F d t [ L ( q ( t ) , v ( t ) , t ) q ( t ) | v ( t ) = q ˙ ( t ) d q ( t ) + L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) d q ˙ ( t ) ]   =   t i t F d t [ L ( q ( t ) , v ( t ) , t ) q ( t ) | v ( t ) = q ˙ ( t ) d q ( t ) + L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) d d t d q ( t ) ]   =   t i t F d t [ L ( q ( t ) , v ( t ) , t ) q ( t ) | v ( t ) = q ˙ ( t ) d d t ( L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) ) ] d q ( t ) + t i t F d t d d t [ L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) d q ( t ) ]

con las condiciones de contorno apropiadas conduce a la ecuación de Euler-Lagrange (EL) , que es la ecuación de movimiento (EOM) .

d d t ( L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) ) (3)   =   L ( q ( t ) , v ( t ) , t ) q ( t ) | v ( t ) = q ˙ ( t )   .

III) Tenga en cuenta que

(4) d d t   =   v ˙ ( t ) v ( t ) + q ˙ ( t ) q ( t ) + t

es una derivada de tiempo total , no una derivada de tiempo explícita t , de modo que la ecuación EL (3) es realmente una ecuación diferencial ordinaria (EDO) de segundo orden,

( q ¨ ( t ) v ( t ) + q ˙ ( t ) q ( t ) + t ) L ( q ( t ) , v ( t ) , t ) v ( t ) | v ( t ) = q ˙ ( t ) (5)   =   L ( q ( t ) , v ( t ) , t ) q ( t ) | v ( t ) = q ˙ ( t )   .

Para resolver el camino q : [ t i , t F ] R , se deben especificar dos condiciones iniciales, por ejemplo,

(6) q ( t i )   =   q i y q ˙ ( t i )   =   v i .

Puede haber una mejor respuesta en la misma línea con esta publicación y el comentario de Christian Blatter math.stackexchange.com/a/1211868/603316 . La "derivada" entre las dos funciones no era realmente una derivada de las variables, sino que se veía como una derivada funcional, d q ( t 2 ) d q ˙ ( t 1 ) = d τ t 2 q ˙ ( t ) d t d q ˙ ( t 1 ) = 0 y esta fue una variación funcional. Puede haber problemas con los términos de contacto, d ( t 1 t 2 ) , que estaba en la región de qm.

Si bien es cierto que la función q ˙ ( t ) es la derivada de la función q ( t ) wrt tiempo, no es cierto que el valor q ˙ está en absoluto relacionado con el valor q en un momento dado, ya que un valor es solo un número, no una función. La acción es un funcional de q ( t ) , por lo que no tendría sentido variar la acción tanto contra q y q ˙ . Pero el lagrangiano L ( q , q ˙ ) es una función de los valores q y q ˙ , no es un funcional de las funciones q ( t ) y q ˙ ( t ) . podemos promover L a una función del tiempo si conectamos q ( t ) y q ˙ ( t ) en lugar de solo q y q ˙ . (Recuerde que un funcional convierte una función en un número, por ejemplo, S [ q ] , mientras que una función convierte un valor en un número, por ejemplo, L ( q , q ˙ ) .

para resolver por q ( t ) extremamos la acción S , exigiendo que sea extrema en todo punto, t . Esto es equivalente a resolver las ecuaciones de Euler-Lagrange en cada punto t . Ya que en cualquier momento t Los valores q y q ˙ son independientes, se pueden variar de forma independiente.

La derivada de una función F ( t ) es la función F ˙ ( t ) en general diferente a F , y en el caso general, los dos ni siquiera son linealmente dependientes, lo cual es simple de ver si toma la expansión de Taylor. Solo después de definir ecuaciones diferenciales con ellos, se vinculan algebraicamente, y esto es lo que hace el cálculo de variaciones.

Si tenemos una función F ( X , v ) , las derivadas parciales están definidas por

F ( X , v ) X límite h 0 F ( X + h , v ) F ( X , v ) h
y
F ( X , v ) v límite h 0 F ( X , v + h ) F ( X , v ) h
Esto implica, por ejemplo, para F = v 2 que
v 2 X límite h 0 v 2 v 2 h = 0.
Además, por v = d X d t encontramos eso X X + h implica v = d X d t v = d ( X + h ) d t = d X d t = v . De este modo
d X d t 2 X límite h 0 d X d t 2 d X d t 2 h = 0.
Por lo tanto, tiene sentido considerar las derivadas parciales del Lagrangiano con respecto a X y v por separado y en este sentido tratarlos de forma independiente.


En términos más físicos, recuerda que nuestro objetivo en el formalismo lagrangiano es averiguar el camino correcto en el espacio de configuración entre dos ubicaciones fijas. Una trayectoria se caracteriza por una ubicación y una velocidad en cada punto en el tiempo. Somos lo más generales posible y consideramos realmente todos los caminos posibles. Esto implica que consideramos todos los pares posibles de ubicaciones y velocidades. El camino clásico físico es especial por dos razones:

  • es una solución de la ecuación de Euler-Lagrange (= extremo de la acción)
  • las ubicaciones y velocidades en cada momento en el tiempo están relacionadas por v d q d t . (Si tu quieres, v d q d t es la segunda ecuación que necesitamos en el formalismo lagrangiano análoga a cómo hay dos ecuaciones de Hamilton en el formalismo hamiltoniano. La segunda ecuación de Hamilton define el momento canónico como una derivada del Lagrangiano. Para trayectorias generales en el espacio de fase, es posible cualquier combinación de ubicación y momento. Solo para el camino físico clásico encontramos valores de momento canónico que se dan como la derivada apropiada del Lagrangiano).

Aunque todas las respuestas parecen cubrir todos los detalles, solo agregaré mi tratamiento para aquellos que tienen ideas afines a mí y pueden encontrarlo beneficioso.

Es útil dividir el símbolo de la derivada parcial (en la ecuación de Euler Lagrange) en dos partes diferentes. Realmente tenemos dos ecuaciones diferentes condensadas en una sola ecuación. Si L ( X , v , t ) después

d d t ( L v ) = F X
v = X ˙

A priori, tienes 3 coordenadas independientes ( X 1 , X 2 , X 3 ) para especificar la posición, y 3 coordenadas independientes ( v 1 , v 2 , v 3 ) para especificar el vector en esa posición. En total, tienes 6 coordenadas independientes ( X 1 , X 2 , X 3 , v 1 , v 2 , v 3 ) que podría tomar cualquier valor que desee. Estas coordenadas significan que hay un vector ( v 1 , v 2 , v 3 ) en la posición ( X 1 , X 2 , X 3 ) .

Lagrangiana es entonces una función de estas coordenadas ( X 1 , X 2 , X 3 , v 1 , v 2 , v 3 ) . A priori, todas estas coordenadas pueden tomar cualquier valor, por lo que se consideran independientes. La ecuación de Euler-Lagrange luego relaciona estas 6 coordenadas de alguna manera. Ahora X 'arena v se vuelve dependiente a través de esta relación. Una vez que obtienes la relación entre estas coordenadas, sustituyes v i = X ˙ i desde un camino X i ( t ) en el espacio de coordenadas corresponderá a un camino ( X i ( t ) , X ˙ i ( t ) ) en el espacio sobre el que se define el lagrangiano. Entonces, en general, tienes dos relaciones diferentes entre X 'arena v 's, uno que derivas de la ecuación de Euler Lagrange y el otro que pones a mano (a saber v i = X ˙ i ). Puedes usar estas relaciones para obtener una ecuación diferencial para X i ( t ) que le permite obtener el camino.

Entonces, puedes ver que X 'arena v Los 's son realmente independientes aquí. Mientras X 'arena X ˙ son obviamente dependientes. si varías X ( t ) por d X ( t ) , X ˙ ( t ) cambiará en consecuencia. Puede verificar que usamos este hecho cuando derivamos la ecuación de Euler-Lagrange del primer principio. La confusión surge porque en la expresión final parece como si los consideráramos independientes, pero en realidad solo los tratamos como independientes en esa expresión. Así que si X ˙ es la velocidad para usted, entonces nunca se considera independiente de X (Simplemente tratado así en la ecuación de Euler Lagrange). Pero si v es la velocidad para usted, entonces se considera correctamente independiente de X .

Editar: en general, el símbolo v se define como X ˙ . En mi tratamiento, es solo otro símbolo que denota un componente de cualquier vector. No inventamos un nuevo símbolo para indicar la velocidad. X ˙ .