Las variables dinámicas en el formalismo lagrangiano

Se ha escrito en la Mecánica clásica de Goldstein que en el formalismo lagrangiano, las variables dinámicas independientes son q q y t t . Es por eso que representamos el estado de un sistema en formalismo lagrangiano utilizando un punto en el espacio de configuración. Pero a lo largo de los cálculos tratamos q ˙ q ˙ también como una variable independiente, como para los cálculos de la ecuación de Euler-Lagrange. Además, Goldstein menciona que matemáticamente tratamos q ˙ q ˙ como variable independiente pero aparte de eso no es así. ¿Cómo no se puede considerar una cantidad matemáticamente independiente mientras se comprende la dinámica del sistema, como al establecer el estado de su?

Respuestas (3)

No tratamos q ˙ q ˙ como una variable independiente en la derivación de las ecuaciones de Euler-Lagrange. La respuesta aproximada es que q q y q ˙ q ˙ son independientes como entradas al Lagrangiano, pero se vinculan una vez que especificamos una ruta a través del espacio de configuración; amplío esto en los puntos 5 y 6.


Seré bastante formal en lo que sigue, pero tal vez la formalidad sea algo esclarecedora. Primero, algunos preliminares:

1: El estado de un norte norte sistema tridimensional consiste en un punto

q ( q 1 q 2 , ... , q norte ) Q q ( q 1 , q 2 , ... , q norte ) Q
dónde Q Q se llama el espacio de configuración correspondiente al sistema, y q yo q yo es el yo t h yo t h coordenadas generalizadas

2: una curva γ γ a través del espacio de configuración es un mapa

γ : R Q γ : R Q
t γ ( t ) = ( q 1 ( t ) , q 2 ( t ) , ... , q norte ( t ) ) q γ ( t ) t γ ( t ) = ( q 1 ( t ) , q 2 ( t ) , ... , q norte ( t ) ) q γ ( t )
Por lo tanto, la curva se parametriza por t t , que llamamos el tiempo. Esto describe cómo evoluciona el estado del sistema. Tenga en cuenta que exigiremos que γ γ ser al menos dos veces diferenciable

3: en cada punto γ γ , existe un vector tangente único V γ ( t ) V γ ( t ) dado de la siguiente manera:

V γ : R T q Q V γ : R T q Q
t V γ ( t ) = ( q ˙ 1 ( t ) , q ˙ 2 ( t ) , ... , q ˙ norte ( t ) ) q ˙ γ ( t ) t V γ ( t ) = ( q ˙ 1 ( t ) , q ˙ 2 ( t ) , ... , q ˙ norte ( t ) ) q ˙ γ ( t )
T q Q T q Q se llama el espacio tangente a Q Q en el punto q q . No me molestaré en definir esto rigurosamente, pero la noción intuitiva de un espacio tangente debería ser familiar si está aprendiendo Goldstein.

4: La unión disjunta de todos los espacios tangentes de Q Q se llama el paquete tangente a Q Q y se denota T Q T Q :

T Q = q Q T q Q T Q = q Q T q Q
Si ( q v ) ( q , v ) es un elemento del paquete tangente T Q T Q entonces eso significa que v v es un vector tangente a alguna curva que pasa por el punto q q .

5: El Lagrangiano es una función que toma tres (o dos, dependiendo de su punto de vista) entradas - un punto ( q , v ) T Q ( q , v ) T Q y un número real t R t R - y los asigna a un número real:

L : T Q × R R L : T Q × R R
( q , v , t ) L ( q , v , t ) ( q , v , t ) L ( q , v , t )
Un punto crucial es que q q no determina v v - hasta L L está preocupado q q es solo un punto en Q Q y v v es el vector tangente a una de las infinitas curvas que atraviesa q q .

6: La acción funcional S S mapea una curva γ γ a un número real de la siguiente manera:

S [ γ ] = L ( q γ ( t ) , q ˙ γ ( t ) , t ) d t S [ γ ] = L ( q γ ( t ) , q ˙ γ ( t ) , t ) re t
Para reiterar el punto anterior, el Lagrangiano tiene tres ranuras: una para un punto en el espacio de configuración, una para un vector tangente y otra para un número real. Hasta L L le preocupa, estas tres ranuras son independientes, por lo que podemos tomar derivadas parciales en nuestro tiempo libre.

Cuando ejecutamos la acción funcional , caminamos a lo largo de la curva γ γ . En cada t t , alimentamos γ ( t ) q γ ( t ) γ ( t ) q γ ( t ) en la primera ranura, V γ ( t ) q ˙ γ ( t ) V γ ( t ) q ˙ γ ( t ) en la segunda ranura, y t t en la tercera ranura. Pero no se puede enfatizar lo suficiente que el Lagrangiano en sí mismo no tiene idea de que las tres entradas tienen algo que ver entre sí.


Ahora que eso está fuera del camino, podemos ponernos manos a la obra. Buscamos algunos γ γ para lo cual la acción funcional es estacionaria. Intuitivamente, pensamos "tomar la derivada y ponerla a cero", pero en esta etapa no está realmente claro cómo tomar una derivada con respecto a una curva.

En cambio, haremos lo siguiente. Denota la curva correcta (pero desconocida) γ C γ C . Luego una curva general γ γ puede escribirse como la "suma" de γ C γ C y algún "error" η η que desaparece en los puntos finales de la integral, y donde la suma se define por componentes. En otras palabras, en algún momento t t ,

q γ ( t ) = q C ( t ) + ϵ η ( t ) ( q c 1 ( t ) + ϵ η 1 ( t ) , q c 2 ( t ) + ϵ η 2 ( t ) , ... , q c N ( t ) + ϵ η norte ( t ) ) q γ ( t ) = q C ( t ) + ϵ η ( t ) ( q C 1 ( t ) + ϵ η 1 ( t ) , q C 2 ( t ) + ϵ η 2 ( t ) , ... , q C norte ( t ) + ϵ η norte ( t ) )

mientras que el vector tangente (también llamado velocidad generalizada) se convierte en

q ˙ γ ( t ) = q ˙ C ( t ) + ϵ η ( t ) ( q ˙ c 1 ( t ) + ϵ η 1 ( t ) , q ˙ c 2 ( t ) + ϵ η 2 ( t ) , ... , q ˙ c N ( t ) + ϵ η norte ( t ) ) q ˙ γ ( t ) = q ˙ C ( t ) + ϵ η ( t ) ( q ˙ C 1 ( t ) + ϵ η 1 ( t ) , q ˙ C 2 ( t ) + ϵ η 2 ( t ) , ... , q ˙ C norte ( t ) + ϵ η norte ( t ) )

dónde ϵ R ϵ R . En lugar de preocuparnos por los detalles de las derivadas funcionales, podemos buscar un camino γ γ lo que hace que la acción sea estacionaria integral con respecto a los cambios en ϵ ϵ :

re S [ γ ] re ϵ = 0 re S [ γ ] re ϵ = 0 0

La acción funcional se convierte en

S [ γ ] = si UN L ( q γ ( t ) , q ˙ γ ( t ) , t ) d t = si UN L ( q C ( t ) + ϵ η ( t ) , q ˙ γ ( t ) + ϵ η ( t ) , t ) d t S [ γ ] = UN si L ( q γ ( t ) , q ˙ γ ( t ) , t ) re t = UN si L ( q C ( t ) + ϵ η ( t ) , q ˙ γ ( t ) + ϵ η ( t ) , t ) re t

Diferenciando con respecto a ϵ ϵ da

re S [ γ ] re ϵ = si UN i = 1 norte [ L q γ yo η yo ( t ) + L q ˙ γ yo η yo ( t ) ] d t re S [ γ ] re ϵ = UN si yo = 1 norte [ L q γ yo η yo ( t ) + L q ˙ γ yo η yo ( t ) ] re t

Ahora reconocemos que

L q ˙ γ yo η yo ( t ) = [ L q ˙ γ yo η yo ( t ) ] - ( d re t L q ˙ γ yo ) η yo ( t ) L q ˙ γ yo η yo ( t ) = [ L q ˙ γ yo η yo ( t ) ] - ( re re t L q ˙ γ yo ) η yo ( t )

y dado que el término límite desaparece en los puntos finales, encontramos que

re S [ γ ] re ϵ = si UN i = 1 norte [ L q γ yo - d re t L q ˙ γ yo ] η yo ( t ) d t re S [ γ ] re ϵ = UN si yo = 1 norte [ L q γ yo - re re t L q ˙ γ yo ] η yo ( t ) re t

Debido a que esta cantidad debe desaparecer para cualquier conjunto independiente de opciones de η yo η yo , se deduce que el integrando debe desaparecer en todas partes, y así

re re t L q ˙ γ yo = L q γ yo re re t L q ˙ γ yo = L q γ yo

Esto nos da las ecuaciones de Euler-Lagrange que nos permiten resolver el camino correcto en términos de coordenadas generalizadas. q γ yo q γ yo .


La especificación de una curva, que vincula las coordenadas generalizadas a las velocidades generalizadas, ocurre al nivel de la acción , no al nivel del Lagrangiano . Hasta L L está preocupado q ( t ) q ( t ) y q ˙ ( t ) q ˙ ( t ) no tienen nada que ver el uno con el otro y se pueden elegir de forma completamente independiente. Esa es la diferencia entre alimentar L L el numero q ( t ) q ( t ) a diferencia de la función q q .

Gracias por la respuesta. ¿Puedes sugerir un libro para leer todo este material?
Es un poco difícil, ya que realmente eliminé la idea de espacios tangentes para evitar profundizar demasiado en la geometría diferencial. Más o menos salteé de un lado a otro entre el tratamiento elemental estándar de la mecánica lagrangiana y el punto de vista múltiple, mientras que casi todo lo que encuentre será uno u otro. Lo más parecido que puedo encontrar es "Formulaciones globales de dinámica lagrangiana y hamiltoniana en los colectores" de Lee, Leok y McClamroch. Una copia puede estar disponible en línea si le pregunta a Almighty Google.
+1 Si queremos ser formales, creo que el "Si η η es pequeño, podemos linealizar "es un poco inconveniente. Pero puede hacerse más riguroso sin sacrificar mucha legibilidad al considerar γ = γ C + ϵ η γ = γ C + ϵ η dónde ϵ ϵ es un número real y encontrar re S [ γ ] / d ϵ = 0 re S [ γ ] / / re ϵ = 0 0 .
@JiK Tienes toda la razón: limpié algunas anotaciones e hice esa edición. Gracias.

El formalismo general de Lagrangia se desarrolla en una variedad j 1 ( E ) j 1 ( mi ) con la estructura de un paquete de chorro construido de un paquete de fibra mi R mi R .

En otras palabras mi mi es localmente el producto de Q Q y R R , dónde Q Q es una variedad donde las configuraciones del sistema se describen en todo momento t R t R .

mi mi está cubierto por parches de coordenadas locales t , q 1 , ... , q norte t , q 1 , ... , q norte dónde t t es la coordenada temporal sobre la base R R del haz de fibras mi R mi R y q 1 , ... , q norte q 1 , ... , q norte cubrir las fibras Q t Q t (difeomorfo a Q Q )

La primera extensión de chorro j 1 ( E ) j 1 ( mi ) terminado R R agranda cada fibra Q t Q t agregando un factor adicional R norte R norte cubierto por coordenadas de chorro , q ˙ 1 , ... , q ˙ norte q ˙ 1 , ... , q ˙ norte independiente de la q 1 , ... , q norte q 1 , ... , q norte pero de tal manera que se identifiquen para re q 1 re t , , d q norte re t re q 1 re t , , re q norte re t tan pronto como una moción t ( t , q 1 ( t ) , ... , q norte ( t ) ) t ( t , q 1 ( t ) , ... , q norte ( t ) ) es dado. En otras palabras ( t , q 1 , ... , q norte q ˙ 1 , ... , q ˙ norte ) ( t , q 1 , ... , q norte , q ˙ 1 , ... , q ˙ norte ) arreglar el estado cinético del sistema a tiempo t t . Aquí la configuración y el estado cinético son completamente independientes. Las fibras de j 1 ( E ) j 1 ( mi ) son por lo tanto 2 n 2 norte multidimensionales UN t UN t , el espacio de estados cinéticos en el tiempo t t , difeomorfo a una fibra canónica UN UN cubierto por coordenadas locales q 1 , ... , q norte q ˙ 1 , ... , q ˙ norte q 1 , ... , q norte , q ˙ 1 , ... , q ˙ norte

En vista de esta estructura, cambiar las coordenadas locales y pasar a t q 1 , ... , q norte q ˙ 1 , ... , q ˙ norte t , q 1 , ... , q norte , q ˙ 1 , ... , q ˙ norte las relaciones son

t = t + c (1) (1) t = t + C
q K = q K ( t , q 1 , ... , q norte ) (2) (2) q k = q k ( t , q 1 , ... , q norte )
q ˙ k = q k t + j = 1 norte q k q j q ˙ j (3) (3) q ˙ k = q k t + j = 1 norte q k q j q ˙ j
y las relaciones inversas tienen la misma estructura.

Usted ve que la tercera ecuación es compatible con la interpretación de q ˙ q ˙ como derivada del tiempo de q q . Esta interpretación es solo formal porque esa derivada no se puede calcular cuando un punto a A t un UN t se da: para calcular dicha derivada necesitaríamos una curva (una sección) que pase por un un , no solo un un sí mismo.

Las ecuaciones de Euler-Lagrange son ecuaciones de primer orden inducidas por una función escalar. L : j 1 ( E ) R L : j 1 ( mi ) R eso, en cada gráfico local determina una sección t γ ( t ) j 1 ( E ) t γ ( t ) j 1 ( mi ) , en coordenadas

t ( t , q ( t ) , q ˙ ( t ) ) , t ( t , q ( t ) , q ˙ ( t ) ) ,
solución de, para k = 1 , ... , n k = 1 , ... , norte ,
re re t L q ˙ k - L q k = 0 . re re t L q ˙ k - L q k = 0 0 .
re q k re t = q ˙ k ( t ) . re q k re t = q ˙ k ( t ) .
Ves eso q ˙ q ˙ resulta ser la derivada del tiempo de q q solo a lo largo de las soluciones de las ecuaciones EL, de lo contrario q q y q ˙ q ˙ son variables independientes

COMENTARIO AÑADIDO ¿Por qué paquetes de jet?

La idea general es encontrar una estructura matemática que codifique la idea de que

q q y q ˙ q ˙ son variables independientes y se vuelven dependientes ( q ˙ q ˙ es la derivada del tiempo de q q ) a lo largo de todas las soluciones de ecuaciones de movimiento.

La primera idea es modelar el espacio de estadísticas cinéticas en el paquete tangente del espacio de configuración T Q T Q dónde Q Q está cubierto por parches de coordenadas lagrangianas q 1 , ... q norte q 1 , ... q norte . aquí q ˙ 1 , ... , q ˙ norte q ˙ 1 , ... , q ˙ norte son los componentes de vectores tangentes en q 1 , ... q norte q 1 , ... q norte (interpretado como vectores tangentes a curvas a través de ese punto parametrizado por medio de la coordenada del tiempo).

Esto es agradable pero, de esta manera, las transformaciones de coordenadas explícitamente dependiendo del tiempo son matemáticamente antinaturales pero físicamente necesarias (piense en las coordenadas lagrangianas en reposo con dos marcos de referencia diferentes, uno inercial y el otro no inercial).

Una salida es usar como espacio-tiempo de estados cinéticos el producto cartesiano A = R × T Q UN = R × T Q , dónde R R es el eje temporal y la visualización de coordenadas admisibles en UN UN como coordenadas ( t , q 1 , ... , q norte q ˙ 1 , ... , q ˙ norte ) ( t , q 1 , ... , q norte , q ˙ 1 , ... , q ˙ norte ) dónde t R t R y q 1 , ... , q norte q 1 , ... , q norte son coordenadas en Q Q y q ˙ 1 , ... , q ˙ norte q ˙ 1 , ... , q ˙ norte son coordenadas en cada fibra de T Q T Q . La coordenada t t , en física clásica se requiere que coincida con el tiempo absoluto y, por lo tanto, se fija solo hasta una constante aditiva. Esto explica por qué restringimos los posibles cambios de coordenadas temporales a la primaria (1).

Esta imagen puede implementarse ya a nivel de espacio de configuraciones, definiendo el espacio-tiempo de configuraciones como mi : = R × Q mi : = R × Q .

En la práctica, esta construcción es efectiva, pero adolece del inconveniente ideológico de que cada cambio de coordenadas (1) - (3) puede usar una realización diferente de mi mi (y UN UN ) como un producto cartesiano como es evidente de las reglas de transformación (2) (y (3)), mientras que en general no existe una elección natural.

Por lo tanto, debemos buscar una estructura que se parezca a un producto cartesiano (al menos localmente), pero su descomposición cartesiana no es canónica y admite un atlas adaptado de gráficos locales cuyas reglas de transformación se establecen en (1) - (3).

El primer paso para eliminar una estructura de producto cartesiana fija es, restringir a (1) y (2) solamente, asumir desde cero que el espacio-tiempo de las configuraciones no es R × Q R × Q pero una variedad que localmente se parece a ese producto sin fijar ninguna elección particular de esta descomposición.

Esta estructura existe y es bien conocida en matemáticas: es un haz de fibras. mi R mi R con fibra canónica difeomorfa a Q Q . El atlas de coordenadas locales adaptado a la estructura del paquete (con coordenadas globales preferidas definidas como una constante aditiva sobre la base R R ) está hecho de cartas locales t , q 1 , ... , q norte t , q 1 , ... , q norte transformando exactamente como en (1) - (2).

Queda por ampliar aún más esta estructura para abarcar la información cinética. El múltiple A = j 1 ( E ) UN = j 1 ( mi ) Es un muy buen candidato. No es más que mi mi con la adición de n = tenue ( Q ) norte = oscuro ( Q ) coordenadas q ˙ 1 , ... q ˙ norte q ˙ 1 , ... q ˙ norte a cada fibra para cada parche de coordenadas naturales t , q 1 , ... , q norte t , q 1 , ... , q norte , con el requisito de que el cambio de coordenadas (3) es cierto. Esto se debe a que, en la definición de paquete de chorro, las coordenadas de punto agregadas deben interpretarse como los componentes de vectores tangentes de secciones en mi mi , es decir, los componentes de todos los posibles vectores tangentes a curvas R t ( q 1 ( t ) , ... , q norte ( t ) ) R t ( q 1 ( t ) , ... , q norte ( t ) ) pasando por cada punto de mi mi .

¿Puede, por favor, explicarme por qué los paquetes de chorros son inevitables en la geometrización de la teoría de campo clásica, pero en principio, uno puede prescindir de ellos en la mecánica de partículas? Al menos, eso es lo que sé. Quizás estoy equivocado.
@DanielC ¡No son inevitables! Simplemente son herramientas útiles para modelar alguna idea física básica. Traté de responder a su pregunta en la nota final que agregué a mi respuesta.
  1. Parte de la pregunta de OP parece ser una cuestión de semántica: si un lagrangiano

    L ( q 1 , ... , q norte v 1 , ... , v norte , t ) (1) (1) L ( q 1 , ... , q norte , v 1 , ... , v norte , t )
    tiene norte norte variables de posición generalizadas independientes q 1 , ... , q norte q 1 , ... , q norte , es decir, el espacio de configuración es norte norte -dimensional, entonces se dice que el sistema tiene norte norte grados de libertad (DOF), cf. por ejemplo, esta publicación de Phys.SE.

    Esta definición de DOF se utiliza a pesar de que las ecuaciones de Lagrange son norte norte ODE acopladas de segundo orden y, por lo tanto, la solución completa tiene 2 n 2 norte constantes de integración, es decir, el número norte norte de DOF se define como la mitad del número de constantes de integración!

  2. Otro problema es que las velocidades generalizadas v 1 , ... , v norte , v 1 , ... , v norte , son variables independientes en el Lagrangiano (1), pero son variables dependientes en la acción

    S [ q 1 , ... , q norte ; t yo t F ]   : =   t F t yo d t   L ( q 1 , ... , q norte q ˙ 1 , ... , q ˙ norte , t ) , (2) (2) S [ q 1 , ... , q norte ; t yo , t F ] : = t yo t F re t L ( q 1 , ... , q norte , q ˙ 1 , ... , q ˙ norte , t ) ,
    Esto se explica, por ejemplo, en esta publicación de Phys.SE.