La ecuación de Lagrange es invariante en CADA transformación de coordenadas. Las ecuaciones de Hamilton no están bajo CADA transformación del espacio de fase. ¿Por qué?

Cuando hacemos una transformación arbitraria de coordenadas invertible y diferenciable

s i = s i ( q 1 , q 2 , . . . q norte , t ) , i ,
la ecuación de Lagrange en términos de coordenadas antiguas
d d t ( L q ˙ i ) L q i = 0 , i
cambios a
d d t ( L ^ s ˙ i ) L ^ s i = 0 , i
dónde L ^ ( s , s ˙ , t ) se obtiene de L ( q , q ˙ , t ) por
L ^ ( s , s ˙ , t ) = L ( q ( s , t ) , q ˙ ( s , s ˙ , t ) , t ) .

Cuando vamos al marco hamiltoniano, las cosas no son tan simples. Bajo una transformación arbitraria en el espacio de fase,

      q i q i ( q 1 , q 2 . . . , pag 1 , pag 2 , . . , t ) , i , PAG i PAG i ( q 1 , q 2 . . . , pag 1 , pag 2 , . . , t ) , i
las ecuaciones de Hamilton no permanecen invariantes. Esto solo sucede para una clase restringida de transformaciones, llamadas transformaciones canónicas. Además, el nuevo hamiltoniano no se obtiene del antiguo hamiltoniano por
H ^ ( q , PAG , t ) = H ( q i ( q , PAG , t ) , pag i ( q , PAG , t ) , t )
incluso cuando la transformación es canónica, a menos que esa transformación canónica sea también una simetría.

¿Por qué es la razón de esto?

Respuestas (3)

Realmente debería pensar en las variables que usamos como coordenadas en algún múltiple, el espacio de configuración (más o menos lo mismo que el espacio de fase, no tendré cuidado con la distinción). En este lenguaje, cambiar variables es equivalente a cambiar coordenadas en esta variedad. La acción es alguna función escalar en este espacio, y podemos tomar derivadas coordinadas, d S d q a con respecto a cualquier coordenada q a estamos usando en el espacio. Como en el cálculo multivariable, podemos formar las derivadas direccionales D v S = v a d S d q a para cualquier vector con componentes v a nos gusta. Si desea algo más formal y geométrico, la derivada direccional es una derivada de Lie en la variedad de configuración.

Ahora, recuerda que cuando variamos la acción, exigimos que la variación sea estacionaria. Es decir, exigimos que todas las derivadas direccionales desaparezcan, lo que significa D v S = 0 para todos los vectores v . Notará que esta declaración sobre la desaparición de las derivadas direccionales es completamente independiente de las coordenadas que usamos, pero no obstante implica que si usamos coordenadas q a , eso d S d q a = 0 para cada a . Pero cualquier sistema de coordenadas daría como resultado la misma condición de que todas las derivadas de coordenadas se desvanecen. Esto también debería ser familiar en algún sentido del cálculo multivariable.

Esto es expresar la invariancia de las ecuaciones de Euler-Lagrange en un lenguaje geométrico. Además de ser agradable, este también será el lenguaje correcto para comprender lo que está sucediendo en la imagen hamiltoniana.

El espacio de fase normalmente está coordinado por pares de coordenadas ( pag a , q a ) , pero esto realmente no es necesario. Al final del día, el espacio de fase es nuevamente una variedad y el ( pag , q ) son simplemente un sistema de coordenadas especial en esa variedad (el teorema de Darboux implica que siempre podemos, al menos localmente, encontrar tal sistema de coordenadas). Lo que realmente define estas coordenadas especiales es que la forma simpléctica toma una forma muy especial.

En caso de que no esté familiarizado con las formas simplécticas, permítame hacer lo siguiente para motivar la idea. En lugar de usar las coordenadas ( pag a , q a ) , en su lugar utilice una coordenada colectiva ξ a = pag a , q a , así que todo lo que realmente he hecho es poner el pag 'arena q 's en un gran vector. Para que quede claro, si q a y pag a eran norte -vectores dimensionales, entonces ξ a es un 2 norte -vector dimensional formado al concatenar los componentes (bueno, cualquier forma de juntar los componentes servirá...esto solo cambiará la forma precisa del Ω Lo presento en un momento permutando sus filas y columnas apropiadamente). En términos de esto, las ecuaciones de Hamilton ahora pueden escribirse

d ξ a d t = Ω a b H ξ b
dónde Ω es alguna matriz. Por lo general, esto se parece a
Ω = ( 0 1 1 0 ) .
Este Ω se conoce típicamente como el inverso de la forma simpléctica. Aunque a veces solo lo escuchará llamar la forma simpléctica (un abuso del lenguaje, pero no poco común) o, más exactamente, un bivector de Poisson. Estos nombres no son tan importantes para lo que quiero decir, pero creo que también puedo mencionar la terminología correcta para cualquiera que quiera intentar buscar en línea por sí mismo.

Ahora, la forma simpléctica, de hecho, se transforma bajo cambios de coordenadas tal como se esperaría que hiciera cualquier objeto tensorial sobre una variedad. Si confiamos en que la forma simpléctica debe transformarse como un tensor bajo cambios de coordenadas, entonces ya sabemos cómo se transforma el lado derecho de la ecuación de Hamilton reescrita si tuviéramos que transformarnos a algún otro sistema de coordenadas. Pero no nos preocupemos por esta suposición y empecemos investigando el lado izquierdo.

Supongamos que realizamos alguna transformación ξ a = ξ a ( ζ ) a un nuevo sistema de coordenadas ζ . Entonces por la regla de la cadena,

d ξ a d t = ξ a ζ m d ζ m d t ,
entonces vemos, tal vez como era de esperar, la derivada del tiempo también se transforma como un tensor bajo un cambio de coordenadas (utilicé m para los índices de las nuevas coordenadas solo para mantener las cosas visualmente distintas).

Entonces, al final, encontramos que las ecuaciones de Hamilton se transforman como

d ξ a d t = Ω a b H ξ b ξ a ζ m d ζ m d t = Ω a b ζ v ξ b H ζ v ,
que si movemos el jacobiano de izquierda a derecha, encontramos
d ζ m d t = ( ζ m ξ a Ω a b ζ v ξ b ) H ζ v
y por lo tanto vemos que si definimos una nueva forma simpléctica Ω por
Ω m v = ζ m ξ a Ω a b ζ v ξ b ,
(que es equivalente a mi afirmación de que Ω debería ser tensorial bajo cambios de coordenadas) La ecuación de Hamilton en realidad es invariante en el sentido de que todavía tenemos ecuaciones de la forma
d ζ m d t = Ω m v H ζ v .
La única diferencia es que los componentes de Ω y Ω puede que no sea lo mismo. Pero realmente esto no debería ser tan sorprendente después de toda esta configuración, ya que no esperaríamos que los componentes de un tensor permanecieran iguales después de un cambio de coordenadas.

Considere como ejemplo la métrica de Minkowski. Sabemos cómo se ve esto en coordenadas cartesianas. Si cambiamos a coordenadas polares, por ejemplo, por supuesto que las entradas de los componentes en la métrica cambian, pero sigue siendo, en un sentido muy real, la misma métrica. Acabamos de tener una nueva representación del mismo.

Entonces, ¿dónde encajan las transformaciones canónicas en todo esto? Son simplemente las transformaciones de coordenadas muy especiales que en realidad dejan invariantes los componentes de la forma simpléctica. Formalmente, se trata de transformaciones de coordenadas generadas por campos vectoriales sobre el espacio de fase cuya derivada de Lie de la forma simpléctica desaparece. Esto es muy similar en muchos aspectos a un campo vectorial que es un vector de eliminación de alguna métrica.

Finalmente, debo señalar que por la forma en que he enmarcado toda la discusión anterior, puede parecer extraño por qué deberíamos considerar las transformaciones canónicas. Después de todo, podemos usar cualquier transformación a costa de una forma agradable para la forma simpléctica. Quizás las transformaciones no canónicas puedan poner las ecuaciones en una forma agradable.

En principio, esto es, por supuesto, cierto. Sin embargo, las transformaciones canónicas juegan un papel muy esencial que está íntimamente ligado al teorema y la simetría de Noether. Esencialmente se puede garantizar que cada simetría de la acción corresponde precisamente a una transformación canónica. Además, solo se garantiza que los campos vectoriales que corresponden a transformaciones canónicas tienen una carga asociada (como el hamiltoniano es la carga asociada a la evolución del tiempo (que en sí misma es una transformación canónica)).

Parece que podría aprender algo aquí, pero tuve que detenerme en ξ a a =< pag a , q a > porque no puedo entenderlo. ξ parece ser una variable de coordenadas, y a e índice. Entonces, ¿por qué hay un a sentado al lado ξ a ? ¿Y qué denotan sus paréntesis angulares?
@garyp Ese segundo a es un error tipográfico Todo lo que estoy haciendo aquí es tomar los dos norte -vectores dimensionales de coordenadas pag a y q a y machacándolos juntos en uno grande 2 norte -vector dimensional ξ a .
@garyp He editado mi respuesta para tratar de hacer esto un poco más claro, pero dado que todo lo que estoy haciendo es reescribir las ecuaciones de movimiento hamiltonianas estándar, debería poder usarlas para poner a tierra cuando digo aquí antes de la coordenada transformación.
Ajá. Entiendo. Estaba tratando de convertir los soportes angulares en un producto. Si hubiera leído sobre el contexto lo habría aclarado. Creo.
  1. Un enfoque más geométrico de la formulación hamiltoniana es considerar la ( 2 norte + 1 ) múltiple de contacto dimensional METRO con coordenadas ( q i , pag j , t ) . El funcional de acción hamiltoniano es

    (1) S H [ γ ]   =   I γ Θ , Θ   =   pag j d q j H d t ,
    dónde γ : I METRO es una curva

    De esto queda claro que el hamiltoniano H no es un objeto escalar sino más bien el t -componente de un 1-forma/co-vector, y por lo tanto se transforma no trivialmente bajo transformaciones de coordenadas. Esto responde a la pregunta principal de OP. Consulte también, por ejemplo, mi respuesta Phys.SE relacionada aquí .

  2. Además, la formulación hamiltoniana se puede generalizar a coordenadas no canónicas, cf. por ejemplo, mi respuesta Phys.SE aquí .

Las otras respuestas han explicado el problema de una manera mayoritariamente matemáticamente formal y rigurosa. Quiero agregar a la discusión tratando de explicar por qué las ecuaciones de movimiento de Lagrange permanecen iguales de una manera informal pero con suerte intuitiva y luego discutir qué es diferente para las ecuaciones de movimiento de Hamilton.

Primero tratemos con Lagrange. Recordemos cuál es el problema real. Tenemos una acción de la forma S = d t L y queremos encontrar la trayectoria para la cual esta acción es extrema. Aquí el Lagrangiano L es (para un punto dado en el tiempo) una función de las propiedades de la trayectoria como la ubicación física real y la velocidad. Para hacer un cálculo, elegimos coordenadas para describir el espacio físico, llámalas q ( t ) , donde la dependencia del Lagrangiano de las propiedades físicas de la trayectoria (y del tiempo, pero supongamos de ahora en adelante que no tenemos una dependencia temporal explícita) ahora se puede escribir como L ( q ( t ) , q ˙ ( t ) , t ) (Solo miro un problema 1D, la generalización a más dimensiones es conceptualmente fácil y de esta manera tengo menos que escribir). Por supuesto, nuestra elección de coordenadas no influye en la solución. Si en cambio tomamos diferentes coordenadas q ( t ) , aún obtendremos la misma trayectoria, solo que en estas diferentes coordenadas, porque el problema que estamos resolviendo es el mismo. Solo tenemos que saber los cambios de coordenadas q ( q ) y q ( q ) y el lagrangiano ahora debe escribirse como L ( q ( q ( t ) ) , q ˙ ( q ( t ) , q ˙ ( t ) ) ) donde la dependencia q ˙ ( q ( t ) , q ˙ ( t ) ) se puede encontrar tomando la derivada temporal de q ( q ( t ) ) .

De hecho, incluso sabemos cómo resolver el problema: la ecuación de movimiento de Lagrange, que como hecho matemático también se conoce como la ecuación de Euler-Lagrane. Esta ecuación establece que la integral d t GRAMO ( X ( t ) , X ˙ ( t ) ) se vuelve extremo si

d d t GRAMO X ˙ GRAMO X = 0
Se ha obtenido utilizando únicamente la información de que la integral (que en nuestro caso es la acción) es extrema. Entonces, si dos personas resuelven el problema, la persona 1 con el q -coordenadas, persona 2 con q , ambos saben que pueden usar la ecuación de Euler Lagrange en sus respectivas coordenadas y ambos obtendrán el mismo resultado, solo cada uno en sus coordenadas, porque ambos resolvieron el mismo problema.

Pero, ¿por qué no es ese el caso de las ecuaciones de movimiento de Hamilton? Para ver eso, echemos un vistazo a cómo pasamos de Lagrange a Hamilton. La idea muy básica es que introducimos una variable "nueva" pag . Por supuesto, esto no es realmente nuevo, de hecho se define como pag = L q ˙ , por lo que en cada punto en el tiempo es una función de q ( t ) y q ˙ ( t ) , es decir pag ( q , q ˙ ) . Suponemos que esta dependencia se puede invertir para encontrar q ˙ = F ( q , pag ) para alguna funcion F . Ahora podemos escribir nuestra acción como S = d t L ( q ( t ) , F ( q ( t ) , pag ( t ) ) ) y de nuevo quiero encontrar funciones q ( t ) y pag ( t ) eso lo hace extremo, ¿verdad? No, eso estaría mal. Al menos si ahora variamos pag y q independientemente, no obtendremos el resultado correcto. En su lugar, tenemos que respetar la condición de que q ˙ = F ( q , pag ) . Así que ahora no solo tenemos un problema de optimización, sino un problema de optimización con restricciones, a saber, que q ˙ = F ( q , pag ) . Para implementar esta restricción se podría utilizar el método de los multiplicadores de Lagrange, es decir, se suma a L un término como λ ( q ˙ F ( q , pag ) ) dónde λ es este multiplicador de Lagrange. Pero esa no es la única posibilidad. En su lugar, agregamos un término pag ( q ˙ F ( q , pag ) ) . Se puede verificar que esto da como resultado la ecuación de movimiento correcta para q al variar pag y q independientemente, es decir, usando la ecuación de Euler-Lagrange para

d t ( L ( q ( t ) , F ( q ( t ) , pag ( t ) ) ) + pag ( t ) ( q ˙ ( t ) F ( q ( t ) , pag ( t ) ) ) )
Reordenando los términos y definiendo H ( q , pag ) = pag F ( q , pag ) L ( q , F ( q , pag ) ) hemos reescrito nuestro problema inicial ahora como la optimización de
d t ( pag ( t ) q ˙ ( t ) H ( q ( t ) , pag ( t ) )
Aquí q y pag variarse de forma independiente. Si hacemos eso obtenemos la ecuación de movimiento de Hamilton.

Pero, ¿dónde falla ahora nuestro argumento anterior cuando consideramos un "cambio de coordenadas"? q ( q , pag ) , PAG ( q , pag ) ? Todavía tenemos un problema de optimización como antes. Pero ahora la diferencia es que, donde antes teníamos una función completamente arbitraria en la integral y simplemente la introducíamos en la ecuación de Euler-Lagrange para obtener la ecuación de movimiento de Lagrange, ahora confiamos en que el integrando tiene una forma específica. Esta forma específica generalmente no se conservará al cambiar las coordenadas. Entonces, por supuesto, todavía podemos usar las ecuaciones de Euler-Lagrange para extremizar la integral, pero no necesariamente obtendremos las ecuaciones de Hamilton en las nuevas coordenadas. Veamos qué pasa:

Como antes, el cambio de coordenadas se puede implementar reemplazando las antiguas variables por las expresiones correspondientes dependiendo de las nuevas variables, es decir q q ( q , PAG ) y pag pag ( q , PAG ) , llevando a

d t ( pag ( q ( t ) , PAG ( t ) ) q ˙ ( q ( t ) , PAG ( t ) ) H ( q ( ( q ( t ) , PAG ( t ) ) ) , pag ( ( q ( t ) , PAG ( t ) ) ) )
teniendo que ser optimizado. Observe que no tiene la forma
d t ( PAG ( t ) q ˙ ( t ) H ( q ( ( q ( t ) , PAG ( t ) ) ) , pag ( ( q ( t ) , PAG ( t ) ) ) )
que sería la expresión que conduce a las ecuaciones de Hamilton en las nuevas coordenadas. De hecho, la diferencia entre el integrando que tenemos y el integrando que nos da las ecuaciones de Hamilton es pag ( q ( t ) , PAG ( t ) ) q ˙ ( q ( t ) , PAG ( t ) ) PAG ( t ) q ˙ ( t ) .

Por supuesto, hay casos en los que esta diferencia no afecta a las ecuaciones reales. Una condición suficiente para ello es que sea una derivada del tiempo total, es decir, algo así como d d t F ( q ( t ) , PAG ( t ) ) para alguna funcion F . Esto conduce a la misma ecuación de movimiento porque al integrar una derivada temporal se obtiene la función F evaluado en los límites del intervalo de integración (que omití en todas partes) y las variaciones de q , pag son cero en el límite (esto se usa en la derivación de la ecuación de movimiento de Lagrange, si no la recuerda, ¡revise esa parte!), por lo que la integral de la derivada del tiempo no cambia bajo la variación.

Por cierto: Esta condición es suficiente, pero no necesaria. Por ejemplo, podría imaginar agregar un término al integrando que sea proporcional al propio integrando. Por supuesto, esto también dejaría invariantes las ecuaciones de movimiento. Pero en el caso de las transformaciones canónicas, generalmente se supone que la diferencia es una derivada del tiempo total.

Ahora sabemos que si pag ( q ( t ) , PAG ( t ) ) q ˙ ( q ( t ) , PAG ( t ) ) PAG ( t ) q ˙ ( t ) es una derivada del tiempo total, es decir, igual a F q q ˙ ( t ) + F PAG PAG ˙ ( t ) , entonces definitivamente obtenemos las ecuaciones de Hamilton en ambos sistemas de coordenadas. También se puede ver que conectando F q q ˙ ( t ) + F PAG PAG ˙ ( t ) en la ecuación de Euler-Lagrange para PAG , q que da trivialmente cero, sin restringir PAG , q de cualquier manera.

Debido a que las segundas derivadas mixtas tienen que ser iguales, es decir 2 F q PAG = 2 F PAG q uno obtiene de pag ( q ( t ) , PAG ( t ) ) q ˙ ( q ( t ) , PAG ( t ) ) PAG ( t ) q ˙ ( t ) = F q q ˙ ( t ) + F PAG PAG ˙ ( t ) la condición q q pag PAG 1 = pag q q PAG que se puede reescribir en la forma más familiar { q , pag } q , PAG = 1 . Esto muestra que este corchete de Poisson es igual a 1 (es decir, el cambio de coordenadas es una transformación canónica) es una condición suficiente para que se conserven las ecuaciones de Hamilton.