Encontrar coordenadas generalizadas cuando falla el teorema de la función implícita

Dadas algunas coordenadas ( X 1 , , X norte ) y h restricciones holonómicas, siempre debería ser posible reducir las coordenadas a norte = norte h coordenadas generalizadas ( q 1 , , q norte ) . Esto está garantizado por el teorema de la función implícita (su aplicación de reducción de coordenadas se menciona brevemente aquí ).

Para una restricción F ( X , y ) = 0 con respecto a solo dos coordenadas, el teorema de la función implícita establece que una función gramo por qué y = gramo ( X ) existe en una vecindad de un punto ( X 0 , y 0 ) satisfaciendo la restricción sólo si

  1. F es continuamente diferenciable, y
  2. F y ( X 0 , y 0 ) 0 .

Sin embargo, este no es siempre el caso.

Ejemplo 1: círculo unitario

Como señaló Emilio Pisanty, un ejemplo fácil es una partícula que debe moverse en el círculo unitario en el ( X , y ) plano: F ( X , y ) = X 2 + y 2 1 = 0 con derivada F y ( X , y ) = 2 y . Al tratar de eliminar y como una coordenada, hay dos soluciones locales: o bien y = 1 X 2 o y = 1 X 2 , por lo tanto, uno puede describir fácilmente el movimiento de la partícula localmente usando el Lagrangiano. Desafortunadamente, hay un problema con dos puntos, ( 1 , 0 ) y ( 1 , 0 ) , porque la derivada F y se convierte en cero, por lo que los puntos que unen las soluciones de y viola la segunda condición y no podemos describir el movimiento global de la partícula (¡la partícula podría "saltar" de una solución a la otra)!

Por supuesto, el problema del ejemplo anterior se resuelve fácilmente eligiendo otras coordenadas iniciales, a saber, coordenadas polares ( r , θ ) . La restricción se convierte en F ( r , θ ) = r 1 = 0 , que cumple ambas condiciones.

Ejemplo 2: cuadrilátero

Imagine dos péndulos que cuelgan de un techo fijo unidos por una cuerda rígida:

ejemplo de dos péndulos atados juntos

Elegir α 1 y α 2 como coordenadas iniciales, sólo hay una restricción: la d -cadena, la yo -las cuerdas y el techo siempre deben formar un cuadrilátero con longitudes dadas para todos los lados.

Con alguna geometría poco interesante, uno puede encontrar una relación entre α 1 y α 2 , como se hizo aquí en una revisión. El punto es que, cuando se les da algo α 1 , hay de nuevo dos posibles soluciones para α 2 : α 2 = ϕ 1 ( α 1 ) + ϕ 2 ( α 1 ) o α 2 = ϕ 1 ( α 1 ) ϕ 2 ( α 1 ) , dónde ϕ 1 y ϕ 2 se definen como en la revisión, pero no son importantes. Aquí hay una ilustración de las dos posibilidades:

dos posibilidades ilustradas

La restricción se puede escribir como F ( α 1 , α 2 ) = | α 2 ϕ 1 ( α 1 ) | ϕ 2 ( α 1 ) = 0 , que viola la primera condición, o se puede escribir como F ( α 1 , α 2 ) = ( α 2 ϕ 1 ( α 1 ) ) 2 ϕ 2 ( α 1 ) 2 = 0 , lo que viola la segunda condición. Nuevamente, no puedo describir el movimiento global del sistema.

En el ejemplo anterior esto podría resolverse eligiendo diferentes coordenadas iniciales, pero no sé si esto se puede hacer aquí. Esto me lleva a mis preguntas.

Preguntas

  • ¿Es siempre posible elegir las coordenadas iniciales de tal manera que todas las restricciones satisfagan las condiciones del teorema de la función implícita?
  • Si es así, ¿existe una forma sistemática de encontrarlos?
  • Si no, ¿sigue siendo posible describir el movimiento global del sistema utilizando el Lagrangiano?
Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .
No se encontró la página 'esta conversación se ha movido al chat'

Respuestas (1)

En términos generales, dado un conjunto de coordenadas X 1 , , X norte bajo un conjunto de h = norte norte restricciones holonómicas de la forma F j ( X 1 , , X norte ) = 0 , no podrá encontrar un subconjunto X 1 , , X norte de sus coordenadas originales que funcionarán globalmente como coordenadas generalizadas: el teorema de la función implícita le dice que localmente tiene garantizado dicho subconjunto, pero en general ese subconjunto no funcionará en todas partes.

Esta es la razón principal por la que trabajamos con coordenadas generalizadas. q 1 , , q norte , porque nos permiten volver a parametrizar el espacio de configuración disponible de una manera que requiere menos gráficos de coordenadas. Sin embargo, incluso esas no son una solución completa, porque, en términos generales, las restricciones definirán el espacio de coordenadas disponible como una variedad que podría requerir dos o más gráficos en su atlas mínimo , es decir, nunca se garantiza la existencia de un conjunto de coordenadas que trabajar globalmente. Algunos ejemplos:

  • Una partícula en un plano confinado al círculo unitario se parametriza mejor a través del ángulo polar, pero incluso esto no es perfecto (no reproduce la periodicidad cuando se toma literalmente).
  • Para algo donde es más claro que los parches de coordenadas simplemente no funcionarán, considere, por ejemplo, una partícula en 3D confinada a la superficie de un toro doble : un solo parche de coordenadas simplemente no podrá hacer frente al género distinto de cero de la superficie.

Esta es la razón por la que la mecánica analítica, cuando se hace correctamente (como, por ejemplo, en el estilo de VI Arnol'd ) funciona de manera abstracta con el espacio de configuración como una variedad y reconoce que los parches de coordenadas solo pueden ser locales, y eso está bien. Esto significa que siempre que su espacio de configuración sea una variedad regular, siempre puede encontrar un gráfico que funcione, y puede resolver la dinámica de una manera explícita dependiente de las coordenadas allí; si la solución se sale del borde del gráfico, entonces siempre puede usar un gráfico separado donde las cosas estén bien.

Sin embargo, para su configuración, no necesita ser particularmente elegante, porque la topología central del problema es generalmente la misma que la del círculo unitario mencionado anteriormente. Esto se puede ver reformulando la restricción en la forma F ( α 1 , α 2 ) = d dónde

F ( α 1 , α 2 ) = ( D yo porque ( α 2 ) , pecado ( α 2 ) ) ( yo porque ( α 1 ) , yo pecado ( α 1 ) ) .
¿Cómo analizas esto? Bueno, eche un vistazo a un diagrama de contorno de F ( α 1 , α 2 ) sobre el α 1 , α 2 avión (tomando yo = D / 2 para la definición):

gráficos matemáticos

Dependiendo de qué d Es decir, su sistema está confinado a una de las curvas de nivel en el gráfico y, en su mayor parte, estos son círculos topológicos del tipo más aburrido y sencillo. Esto significa que puede encontrar una coordenada generalizada de tipo de ángulo único que parametriza la totalidad de la variedad del espacio de configuración módulo los mismos problemas de periodicidad que obtiene para una partícula confinada al círculo unitario.

Esto no quiere decir que encontrar esa coordenada sea fácil y, de hecho, (i) es probable que su forma analítica sea bastante complicada y (ii) este desorden se reflejará y amplificará en las ecuaciones de movimiento de Euler-Lagrange. En este caso específico, no creo que se gane nada tratando de encontrar tal coordenada (en lugar de simplemente usar α 1 y α 2 como variables independientes en los gráficos donde trabajan, obteniendo y resolviendo los EOM de Euler-Lagrange en esa parametrización, y simplemente siendo consciente de cuándo uno podría necesitar cambiar de gráfico), pero en última instancia es una elección personal.


Ahora, dicho esto, hay algunas situaciones (muy específicas) en las que el espacio de coordenadas podría no ser una variedad, esencialmente porque F ( α 1 , α 2 ) no tiene un gradiente distinto de cero. Para su problema, esto ocurre, por ejemplo, en el d = 0.9 D línea de contorno cuando yo = 0,95 D , que se parece a esto,

gráficos matemáticos

es decir, tiene un cruce en α 1 = α 2 = 0 , donde los dos brazos están 'cruzados', y puede salir de la configuración tirando de uno de los brazos y haciendo que el otro lo siga, es decir, a través de dos rutas distintas. Este tipo de configuración es la peor que encontrará en los sistemas que ha mencionado, pero, en realidad, es casi seguro que nunca la encuentre, por lo que generalmente está bien descartar la posibilidad como un caso de esquina patológico para que los matemáticos se preocupen. sobre.

Si insiste en manejarlo, lo que generalmente sucederá desde la perspectiva de un físico es que el sistema tenderá a tener cierta inercia, y eso tenderá a llevarlo en la misma 'rama' en la que se encuentra. (O, en otras palabras, parametriza la curva en forma de ocho de forma regular, con un autocruce que luego ignora). Esto funcionará para todos los casos, excepto aquellos en los que el sistema está en el cruce con velocidad cero. , en cuyo caso permanecerá allí o solo llegará asintóticamente (pero, si realmente presionas las cosas, sí: la mecánica lagrangiana no está definida después de llegar a ese tipo de punto patológico).

O dicho de otro modo, este tipo de problema no es realmente un problema.

Gran respuesta. Solo puedo admirarlo.
Aunque tengo algunos comentarios sobre trivialidades solo para verificar si entendí mal algo. (1) "en lugar de simplemente usar α 1 y α 2 como variables independientes" Supongo que te refieres a variables dependientes , ya que su dependencia es de lo que trata la pregunta. (2) "esto ocurre, por ejemplo, en el d = 0.9 D línea de contorno cuando yo = 0,95 d " Creo que quisiste decir yo = 0,95 D , de lo contrario α 1 = α 2 = 0 no es una configuración válida.
(3) "que los parches de coordenadas solo pueden ser locales, y eso está bien" Me cuesta entender cómo esto está bien en la práctica. Para el caso del círculo unitario donde y = ± ( 1 X 2 ) , cualquier ecuación de movimiento tendrá un punto singular para X = ± 1 , entonces, ¿cómo cambiará los gráficos cuando el movimiento intermedio no esté definido?
(para (3), debo confesar que soy un principiante cuando se trata de topología. Puede ser que no haya entendido bien el significado exacto de variedades, parches de coordenadas o gráficos, así que espero que la pregunta tenga sentido)
En (2): tienes toda la razón, eso fue un error tipográfico.
En (1), me refiero al uso de múltiples gráficos diferentes: dos en los que α 1 es independiente y α 2 es dependiente, y dos en los que α 2 es la variable independiente. Esto es similar a la respuesta a (3): cuando el movimiento se acerca a ( 1 , 0 ) , simplemente cambias al gráfico X = 1 y 2 y use y como su variable independiente allí. Una vez que esté libre de ese punto, puede cambiar al otro signo de y = ± 1 X 2 si así lo deseas.
En otras palabras, la idea de los gráficos no es que sus bordes coincidan exactamente, sino que sus dominios se superponen de modo que para cualquier punto dado haya un gráfico tal que el punto esté en el interior del gráfico.