Cuando hacemos una transformación arbitraria de coordenadas invertible y diferenciable
Cuando vamos al marco hamiltoniano, las cosas no son tan simples. Bajo una transformación arbitraria en el espacio de fase,
¿Por qué es la razón de esto?
Realmente debería pensar en las variables que usamos como coordenadas en algún múltiple, el espacio de configuración (más o menos lo mismo que el espacio de fase, no tendré cuidado con la distinción). En este lenguaje, cambiar variables es equivalente a cambiar coordenadas en esta variedad. La acción es alguna función escalar en este espacio, y podemos tomar derivadas coordinadas, con respecto a cualquier coordenada estamos usando en el espacio. Como en el cálculo multivariable, podemos formar las derivadas direccionales para cualquier vector con componentes nos gusta. Si desea algo más formal y geométrico, la derivada direccional es una derivada de Lie en la variedad de configuración.
Ahora, recuerda que cuando variamos la acción, exigimos que la variación sea estacionaria. Es decir, exigimos que todas las derivadas direccionales desaparezcan, lo que significa para todos los vectores . Notará que esta declaración sobre la desaparición de las derivadas direccionales es completamente independiente de las coordenadas que usamos, pero no obstante implica que si usamos coordenadas , eso para cada . Pero cualquier sistema de coordenadas daría como resultado la misma condición de que todas las derivadas de coordenadas se desvanecen. Esto también debería ser familiar en algún sentido del cálculo multivariable.
Esto es expresar la invariancia de las ecuaciones de Euler-Lagrange en un lenguaje geométrico. Además de ser agradable, este también será el lenguaje correcto para comprender lo que está sucediendo en la imagen hamiltoniana.
El espacio de fase normalmente está coordinado por pares de coordenadas , pero esto realmente no es necesario. Al final del día, el espacio de fase es nuevamente una variedad y el son simplemente un sistema de coordenadas especial en esa variedad (el teorema de Darboux implica que siempre podemos, al menos localmente, encontrar tal sistema de coordenadas). Lo que realmente define estas coordenadas especiales es que la forma simpléctica toma una forma muy especial.
En caso de que no esté familiarizado con las formas simplécticas, permítame hacer lo siguiente para motivar la idea. En lugar de usar las coordenadas , en su lugar utilice una coordenada colectiva , así que todo lo que realmente he hecho es poner el 'arena 's en un gran vector. Para que quede claro, si y eran -vectores dimensionales, entonces es un -vector dimensional formado al concatenar los componentes (bueno, cualquier forma de juntar los componentes servirá...esto solo cambiará la forma precisa del Lo presento en un momento permutando sus filas y columnas apropiadamente). En términos de esto, las ecuaciones de Hamilton ahora pueden escribirse
Ahora, la forma simpléctica, de hecho, se transforma bajo cambios de coordenadas tal como se esperaría que hiciera cualquier objeto tensorial sobre una variedad. Si confiamos en que la forma simpléctica debe transformarse como un tensor bajo cambios de coordenadas, entonces ya sabemos cómo se transforma el lado derecho de la ecuación de Hamilton reescrita si tuviéramos que transformarnos a algún otro sistema de coordenadas. Pero no nos preocupemos por esta suposición y empecemos investigando el lado izquierdo.
Supongamos que realizamos alguna transformación a un nuevo sistema de coordenadas . Entonces por la regla de la cadena,
Entonces, al final, encontramos que las ecuaciones de Hamilton se transforman como
Considere como ejemplo la métrica de Minkowski. Sabemos cómo se ve esto en coordenadas cartesianas. Si cambiamos a coordenadas polares, por ejemplo, por supuesto que las entradas de los componentes en la métrica cambian, pero sigue siendo, en un sentido muy real, la misma métrica. Acabamos de tener una nueva representación del mismo.
Entonces, ¿dónde encajan las transformaciones canónicas en todo esto? Son simplemente las transformaciones de coordenadas muy especiales que en realidad dejan invariantes los componentes de la forma simpléctica. Formalmente, se trata de transformaciones de coordenadas generadas por campos vectoriales sobre el espacio de fase cuya derivada de Lie de la forma simpléctica desaparece. Esto es muy similar en muchos aspectos a un campo vectorial que es un vector de eliminación de alguna métrica.
Finalmente, debo señalar que por la forma en que he enmarcado toda la discusión anterior, puede parecer extraño por qué deberíamos considerar las transformaciones canónicas. Después de todo, podemos usar cualquier transformación a costa de una forma agradable para la forma simpléctica. Quizás las transformaciones no canónicas puedan poner las ecuaciones en una forma agradable.
En principio, esto es, por supuesto, cierto. Sin embargo, las transformaciones canónicas juegan un papel muy esencial que está íntimamente ligado al teorema y la simetría de Noether. Esencialmente se puede garantizar que cada simetría de la acción corresponde precisamente a una transformación canónica. Además, solo se garantiza que los campos vectoriales que corresponden a transformaciones canónicas tienen una carga asociada (como el hamiltoniano es la carga asociada a la evolución del tiempo (que en sí misma es una transformación canónica)).
Un enfoque más geométrico de la formulación hamiltoniana es considerar la múltiple de contacto dimensional con coordenadas . El funcional de acción hamiltoniano es
De esto queda claro que el hamiltoniano no es un objeto escalar sino más bien el -componente de un 1-forma/co-vector, y por lo tanto se transforma no trivialmente bajo transformaciones de coordenadas. Esto responde a la pregunta principal de OP. Consulte también, por ejemplo, mi respuesta Phys.SE relacionada aquí .
Además, la formulación hamiltoniana se puede generalizar a coordenadas no canónicas, cf. por ejemplo, mi respuesta Phys.SE aquí .
Las otras respuestas han explicado el problema de una manera mayoritariamente matemáticamente formal y rigurosa. Quiero agregar a la discusión tratando de explicar por qué las ecuaciones de movimiento de Lagrange permanecen iguales de una manera informal pero con suerte intuitiva y luego discutir qué es diferente para las ecuaciones de movimiento de Hamilton.
Primero tratemos con Lagrange. Recordemos cuál es el problema real. Tenemos una acción de la forma y queremos encontrar la trayectoria para la cual esta acción es extrema. Aquí el Lagrangiano es (para un punto dado en el tiempo) una función de las propiedades de la trayectoria como la ubicación física real y la velocidad. Para hacer un cálculo, elegimos coordenadas para describir el espacio físico, llámalas , donde la dependencia del Lagrangiano de las propiedades físicas de la trayectoria (y del tiempo, pero supongamos de ahora en adelante que no tenemos una dependencia temporal explícita) ahora se puede escribir como (Solo miro un problema 1D, la generalización a más dimensiones es conceptualmente fácil y de esta manera tengo menos que escribir). Por supuesto, nuestra elección de coordenadas no influye en la solución. Si en cambio tomamos diferentes coordenadas , aún obtendremos la misma trayectoria, solo que en estas diferentes coordenadas, porque el problema que estamos resolviendo es el mismo. Solo tenemos que saber los cambios de coordenadas y y el lagrangiano ahora debe escribirse como donde la dependencia se puede encontrar tomando la derivada temporal de .
De hecho, incluso sabemos cómo resolver el problema: la ecuación de movimiento de Lagrange, que como hecho matemático también se conoce como la ecuación de Euler-Lagrane. Esta ecuación establece que la integral se vuelve extremo si
Pero, ¿por qué no es ese el caso de las ecuaciones de movimiento de Hamilton? Para ver eso, echemos un vistazo a cómo pasamos de Lagrange a Hamilton. La idea muy básica es que introducimos una variable "nueva" . Por supuesto, esto no es realmente nuevo, de hecho se define como , por lo que en cada punto en el tiempo es una función de y , es decir . Suponemos que esta dependencia se puede invertir para encontrar para alguna funcion . Ahora podemos escribir nuestra acción como y de nuevo quiero encontrar funciones y eso lo hace extremo, ¿verdad? No, eso estaría mal. Al menos si ahora variamos y independientemente, no obtendremos el resultado correcto. En su lugar, tenemos que respetar la condición de que . Así que ahora no solo tenemos un problema de optimización, sino un problema de optimización con restricciones, a saber, que . Para implementar esta restricción se podría utilizar el método de los multiplicadores de Lagrange, es decir, se suma a un término como dónde es este multiplicador de Lagrange. Pero esa no es la única posibilidad. En su lugar, agregamos un término . Se puede verificar que esto da como resultado la ecuación de movimiento correcta para al variar y independientemente, es decir, usando la ecuación de Euler-Lagrange para
Pero, ¿dónde falla ahora nuestro argumento anterior cuando consideramos un "cambio de coordenadas"? , ? Todavía tenemos un problema de optimización como antes. Pero ahora la diferencia es que, donde antes teníamos una función completamente arbitraria en la integral y simplemente la introducíamos en la ecuación de Euler-Lagrange para obtener la ecuación de movimiento de Lagrange, ahora confiamos en que el integrando tiene una forma específica. Esta forma específica generalmente no se conservará al cambiar las coordenadas. Entonces, por supuesto, todavía podemos usar las ecuaciones de Euler-Lagrange para extremizar la integral, pero no necesariamente obtendremos las ecuaciones de Hamilton en las nuevas coordenadas. Veamos qué pasa:
Como antes, el cambio de coordenadas se puede implementar reemplazando las antiguas variables por las expresiones correspondientes dependiendo de las nuevas variables, es decir y , llevando a
Por supuesto, hay casos en los que esta diferencia no afecta a las ecuaciones reales. Una condición suficiente para ello es que sea una derivada del tiempo total, es decir, algo así como para alguna funcion . Esto conduce a la misma ecuación de movimiento porque al integrar una derivada temporal se obtiene la función evaluado en los límites del intervalo de integración (que omití en todas partes) y las variaciones de son cero en el límite (esto se usa en la derivación de la ecuación de movimiento de Lagrange, si no la recuerda, ¡revise esa parte!), por lo que la integral de la derivada del tiempo no cambia bajo la variación.
Por cierto: Esta condición es suficiente, pero no necesaria. Por ejemplo, podría imaginar agregar un término al integrando que sea proporcional al propio integrando. Por supuesto, esto también dejaría invariantes las ecuaciones de movimiento. Pero en el caso de las transformaciones canónicas, generalmente se supone que la diferencia es una derivada del tiempo total.
Ahora sabemos que si es una derivada del tiempo total, es decir, igual a , entonces definitivamente obtenemos las ecuaciones de Hamilton en ambos sistemas de coordenadas. También se puede ver que conectando en la ecuación de Euler-Lagrange para que da trivialmente cero, sin restringir de cualquier manera.
Debido a que las segundas derivadas mixtas tienen que ser iguales, es decir uno obtiene de la condición que se puede reescribir en la forma más familiar . Esto muestra que este corchete de Poisson es igual a 1 (es decir, el cambio de coordenadas es una transformación canónica) es una condición suficiente para que se conserven las ecuaciones de Hamilton.
garyp
ricardo myers
ricardo myers
garyp