¿Cuándo/por qué el principio de acción mínima más las condiciones de contorno no especifican únicamente un camino?

Hace unos meses les estaba hablando a estudiantes de secundaria sobre el principio de Fermat.

Puedes usarlo para mostrar que la luz se refleja en una superficie en ángulos iguales. Para configurarlo, establece condiciones límite, como "la luz comienza en A y termina en B". Pero estas condiciones por sí solas son insuficientes para determinar cuál es el camino, porque hay un camino de tiempo estacionario extra irrelevante, que es la luz que va directamente de A a B sin rebotar en la superficie. Nos deshacemos de esto agregando otra condición límite, es decir, que solo nos importan las rutas que realmente rebotan. Entonces la solución es única.

Por supuesto, en cuanto terminé de decir esto, uno de los estudiantes preguntó "¿y si estás dentro de un espejo elíptico y A y B son los dos focos?" En este caso, puede imponer la condición "solo nos importan los caminos que golpean el espejo", pero esto no determina el camino en absoluto porque cualquier camino que consiste en una línea recta desde A hasta el espejo, seguido de un línea recta a B, tomará el mismo tiempo! Entonces, en este caso, el principio no nos dice nada en absoluto.

El hecho de que no podamos obtener información alguna de un principio de acción resulta perturbador. ¡Pensé que el modelo estándar estaba basado en uno de esos!

mis preguntas son

  • ¿Es esto algo más que una curiosidad matemática? ¿Surge esto como un problema/obstáculo en la física superior?
  • ¿Hay una forma matemáticamente natural más agradable de establecer la condición de "solo contar rutas de rebote"? Además, ¿existe una condición "agradable" que especifique una ruta en el caso de la elipse?
  • ¿Qué debería haberle dicho a ese estudiante?
Me inclino a dejar esto abierto ya que la otra pregunta está en el contexto de QFT, y sería bueno tener respuestas de propósito general que no dependan de la intuición de QFT (falta de).

Respuestas (7)

Las múltiples soluciones clásicas a las ecuaciones de Euler-Lagrange con condiciones de contorno pertinentes/bien planteadas (tales soluciones a veces se denominan instantones ) son un fenómeno común en la física, cf. por ejemplo , esta publicación relacionada con Phys.SE y sus enlaces.

En óptica, es bien sabido que, por ejemplo, dos espejos pueden crear múltiples caminos clásicos.

¡Gracias por la respuesta! Ahora me doy cuenta de que múltiples rutas clásicas válidas están bien en QM, ya que todas contribuirán a la integral de la ruta. Pero solo trabajando de forma clásica, ¿es un problema? Pensé que los principios de acción eran equivalentes a solo Newton, por lo que siempre deberían fijar un camino.
El segundo de @KevinZhou Newton no siempre determina un camino, considere, por ejemplo V ( X ) = k r 4 / 3 y X ( 0 ) = v ( 0 ) = 0. La fuerza es cero, por lo que el primero de Newton dice que permanece en reposo, pero el segundo de Newton está bien con soluciones en las que simplemente tiene una aceleración instantánea de cero, como moverse cúbicamente en el tiempo.

En realidad, la ruta adicional no es irrelevante. Si pones una bombilla en A y una 4 π detector (esto significa 4 π cobertura estereorradián, es decir, detecta la luz entrante en cualquier dirección) en B, el detector verá luz a lo largo de ambos caminos: directo y rebotado en el espejo, que es exactamente el resultado que obtuvo del Principio de Fermat. Si desea excluir el camino directo, debe bloquearlo con una pared opaca.

Lo mismo ocurre con el espejo elíptico: el detector verá la luz que entra desde todas las direcciones, que es nuevamente lo que dice el Principio de Fermat: cada camino tiene un tiempo de viaje estacionario (es decir, cero variación de primer orden), y por lo tanto cada camino es uno válido para la luz.

En la mecánica lagrangiana, por otro lado, el estado del sistema contiene tanto la posición como la velocidad: es un estado en el espacio de fase, no en el espacio real. No tienes que lidiar con reflejos en el espacio de fase, y eso generalmente descarta estos casos en los que tienes un número infinito de caminos por los cuales una partícula podría pasar del estado A al estado B.

No sé si los caminos que se mueven en línea recta entre ellos son tan válidos para la elipse como los otros caminos ya que tiene que pasar por el 4 π detector en un momento anterior. Si esperas a colocarlo hasta que haya pasado la luz podría funcionar. Pero luego también debe eliminar la fuente para evitar bloquear su propia luz. Y dado que hay casos con solución múltiple incluso con sistemas de segundo orden, simplemente decir que es inusual es un poco vago.

¿Es esto algo más que una curiosidad matemática?

No es una curiosidad. La luz recorre todos esos caminos.

¿Surge esto como un problema/obstáculo en la física superior?

No estoy seguro de qué es "esto". Sí, la gente a veces pensará erróneamente que hay una solución única cuando no la hay. Puede haber múltiples geodésicas entre los mismos eventos (incluso si para regiones lo suficientemente pequeñas esto no es cierto), puede haber múltiples soluciones para F = metro a . Pero, ¿qué tan importante es tener una solución única?

Claro, hacer una integral de ruta podría ser molesto cuando no hay una ruta única, pero si esas fallas son pequeñas en una medida teórica, no importa. Pero las personas no están expuestas a la teoría de la medida desde el principio. Entonces pueden confundirse con cualquier cosa, como que algo que sucede con probabilidad 1 puede no suceder o que algo que sucede con probabilidad 0 puede suceder. Pueden suceder , pero no se supone que sea un gran problema.

Ese es un síntoma general de las personas que intentan vender historias demasiado simplificadas, es genial desarrollar la intuición física, pero no es correcto dejar que las personas piensen que sus intuiciones son más correctas de lo que son.

¿Hay una forma matemáticamente natural más agradable de establecer la condición de "solo contar rutas de rebote"?

No, eso está mal.

Además, ¿existe una condición "agradable" que especifique una ruta en el caso de la elipse?

Su objetivo es demostrar que se sigue un camino único cuando no es así.

¿Qué debería haberle dicho a ese estudiante?

Podrías separar claramente una expectativa de un requisito. Los ejemplos de probabilidad 1 pueden ser útiles, ya que muchas de las rutas no únicas ocurren con probabilidad 0 si elige las condiciones iniciales al azar.

Si estableces que el propósito de la ciencia es hacer predicciones y que los sesgos o las expectativas pueden afectarte, entonces enseñar relatividad, mecánica cuántica y relatividad general más adelante podría ser mejor si las personas pueden dejar de lado su equipaje y admitir que solo quieren aprender una teoría para ver lo que predice la teoría y ver si la teoría está de acuerdo con lo que vemos. Y que una teoría no tiene que respetar tus opiniones humanas sobre lo que crees que debería o no debería hacer.

En este caso, la predicción es si un detector ve luz desde una dirección particular en un momento particular. Si la luz sale en muchas direcciones, es razonable pensar que puede llegar desde muchas direcciones. Dado que hay divisores de haz y espejos medio plateados, puede llegar desde múltiples direcciones, incluso si sale en una sola.

Incluso podrías jugar al laberinto láser, es un juego real (mayores de 8 años, sin afiliación).

En cuanto a su pregunta de título, estoy interesado en una respuesta porque escucho a la gente decir que hay soluciones únicas todo el tiempo, pero incluso dicen eso cuando no hay una solución única, así que no sé por qué dicen eso. En cualquier sentido de por qué, no sé en qué teorema están pensando o incluso por qué quieren ese resultado. ¿Solo porque?

¿Qué debería haberle dicho a ese estudiante?

El principio de Fermat es interesante, pero en caso de duda utilice las leyes básicas de reflexión y refracción.

También es bueno darse cuenta de que el principio de Fermat no da un camino real que seguirá el rayo de luz, da los caminos posibles. Cuáles se realizarán depende también de cosas como la orientación de la fuente de rayos de luz. Si la fuente de luz en un foco brilla en todas las direcciones, todos esos rayos de un foco a otro se realizarán.

El principio de Fermat dice que la luz elige el camino con el camino óptico mínimo o el tiempo mínimo. Puede ser directo o indirecto (conteniendo reflexiones o refracciones). Pero como dijeron otros, no es necesariamente único, porque puede haber rutas todas con rutas ópticas mínimas, es decir, todas con rutas ópticas mínimas iguales. Eso es exactamente lo que sucede en un espejo elíptico. Es la definición de elipse que todos los caminos entre los dos focos que incluyen un reflejo son iguales. Por eso la imagen del objeto en un foco se forma en el otro foco. Si todos los caminos no fueran iguales, no habría necesariamente una interferencia constructiva que condujera a la formación de imágenes. Son todos caminos mínimos y REALMENTE son elegidos por la luz. Pero siempre hay algunas barreras (como tu mano sosteniendo la fuente de luz) que bloquean algunos de estos caminos. Entonces la luz no pasará por alto, porque este nuevo camino ya no es un camino mínimo. En cuanto al camino directo entre los dos focos, también es un mínimo, pero con respecto a los caminos en su vecindad, no los caminos mencionados anteriormente. Así que también es una elección.

Hay otra clase de situaciones extremadamente importante desde el punto de vista conceptual en las que hay múltiples trayectorias de acción estacionaria con las mismas condiciones de contorno: situaciones en las que el lagrangiano tiene una simetría que deja invariables las condiciones de contorno pero cambia la trayectoria que las conecta.

El ejemplo más simple es simplemente un objeto puntual confinado a la superficie de una esfera y que siente la influencia de la gravedad, que inicialmente se equilibra justo en la parte superior de la esfera. Claramente, si espera lo suficiente, eventualmente se deslizará por la parte superior y eventualmente terminará en la parte inferior. Pero dadas las condiciones de contorno "comienza en la parte superior" y "termina en la parte inferior un tiempo T después", ¿qué línea de longitud desciende para llegar allí? Obviamente, no puede haber una sola respuesta correcta por la simetría axial de la esfera, pero el objeto termina físicamente deslizándose hacia abajo una línea. Este concepto se conoce como "espontáneo". ruptura de simetría" y es la piedra angular de gran parte de la física. La literatura sobre este tema es realmente asombrosamente grande, por lo que no tendrá problemas para encontrar más información.

Soy consciente de que esta pregunta se envió hace 7 años. Puede ser que en los años transcurridos desde que haya encontrado una respuesta a través de otros medios. Por otra parte, tal vez no, así que estoy publicando esta respuesta.

1 La acción estacionaria de Hamilton
Primero mostraré que para la acción estacionaria de Hamilton existe un caso similar: un caso donde hay un rango de caminos con valor idéntico para la acción correspondiente. Para reducir a una trayectoria específica , se debe proporcionar una condición inicial .

2 Hipótesis del frente de onda de Huygens
Proporcionaré una derivación del tiempo estacionario de Fermat a partir de la hipótesis del frente de onda de Huygens. (La derivación habitual, por supuesto, es mostrar que el tiempo estacionario de Fermat produce la ley de Snell. Explicaré por qué procedo de la hipótesis del frente de onda de Huygens como punto de partida).

3 ¿Qué da?
Debe tenerse en cuenta la observación de que, en algunos casos, el camino no se determina de forma única. Discutiré cómo proceder.



Como usted dice: el espejo curvo en forma de elipse es un caso en el que hay una variedad de caminos que tienen todos la misma acción de Fermat; todos toman la misma cantidad de tiempo para atravesar.

La acción estacionaria de Hamilton tiene un caso similar:

La oscilación armónica idealizada tiene la siguiente propiedad: la energía potencial aumenta cuadráticamente con el desplazamiento desde el punto de equilibrio. Esto le da a la oscilación armónica idealizada una propiedad única: la cantidad de energía potencial es igual a la cantidad de energía cinética.

De aquí en adelante abreviaré Oscilación Armónica Idealizada como OHI

Como sabemos, en el caso de la OHI la amplitud y el periodo son independientes; todas las amplitudes de la oscilación tienen el mismo período.


La acción estacionaria de Hamilton debe corroborar: en el caso de IHO la amplitud y el período son independientes. Lo siguiente verifica que:

Para la trayectoria utilizo la función seno, y para las condiciones de contorno utilizo t = 0 como punto de partida y t = π como punto final (medio ciclo).

La derivada de la función seno es la función coseno, por lo que la energía cinética es proporcional al cuadrado del coseno. Con oscilación armónica la energía potencial es proporcional al cuadrado del desplazamiento. La elección natural del punto cero de energía potencial es ponerlo en desplazamiento cero.

Usando S para la acción de Hamilton y un factor de multiplicación a para amplitud:

(1.1) S = 0 π ( 1 2 ( a porque ( t ) ) 2 1 2 ( a pecado ( t ) ) 2 ) d t

(Es posible que haya fallado en un signo menos en la ecuación anterior, o algo peor, pero me entiendes).

Cuando se evalúa para exactamente medio ciclo de la oscilación (o un múltiplo entero de medio ciclo): el seno al cuadrado y el coseno al cuadrado disminuirán uno contra el otro, y el factor de multiplicación a caerá con ellos.

Entonces tenemos corroboración: en el caso de IHO: cuando las condiciones de contorno se establecen para evaluar medio ciclo (o múltiplo entero), entonces para cada amplitud , el valor de la acción de Hamilton es idéntico.


Por supuesto, esta propiedad de la OHI nunca se presenta como un obstáculo. La ecuación que en realidad se utiliza es la ecuación de Euler-Lagrange; una ecuación diferencial. Cuando se usa una ecuación diferencial, la forma de reducirla a una sola trayectoria es proporcionar condiciones iniciales suficientemente restrictivas .

Lo que hacen los autores de libros de texto es esto: la acción estacionaria de Hamilton se usa como contexto para derivar la ecuación de Euler-Lagrange. Cuando se aplica la mecánica de Lagrange, la ecuación que se utiliza es la ecuación de Euler-Lagrange, no el concepto de acción de origen.



2 Hipótesis del frente de onda de Huygens

(Prefiero el nombre 'hipótesis del frente de onda' al principio de Huygens. En mi opinión, la calificación 'Principio' se usa con demasiada frecuencia. Si todo es un principio, entonces la palabra 'principio' no tiene sentido).

Tenemos que el conjunto de observaciones de la refracción se puede expresar con una sola ley empírica: la ley de Snell.

El tiempo estacionario de Fermat y la hipótesis del frente de onda de Huygens tienen lo siguiente en común: tratan de explicar la ley de Snell suponiendo que la velocidad de la luz, aunque en muchos órdenes de magnitud es más rápida que cualquier otra cosa, es finita, que la velocidad de la luz en cada medio es una constante , y que para cada medio el índice de refracción es el inverso de la velocidad de la luz en ese medio. Implicación: con una velocidad constante de la luz (para cada medio específico) hay (para cada medio) una relación fija de distancia recorrida y el tiempo que tarda en atravesar.


Refracción por reconstitución de frente de onda

Diagrama 1, Reconstitución del frente de onda

El diagrama también tiene un factor 'd' para el ancho del frente de onda que se propaga, pero este ancho no afecta el ángulo de refracción y, en consecuencia, en las ecuaciones el factor 'd' desaparece.


Derivada de la longitud de la hipotenusa

Diagrama 2 (GIF animado), relación entre la longitud de la hipotenusa C y el lado opuesto A

En preparación, derivo una expresión para la tasa de cambio de la longitud de la hipotenusa C a medida que cambia la longitud del lado opuesto A:

(2.1) d C d A = d ( A 2 + B 2 ) d A = A A 2 + B 2 = A C

con los pasos intermedios eliminados:

(2.2) d C d A = A C


Tiempo estacionario de Fermat

Diagrama 3, tiempo estacionario de Fermat

En el Diagrama 3, la letra 'S' significa 'punto de Snell'. Tomo como punto de partida que hay un punto fijo desde donde se transmite la luz, el punto 'T', y que hay un punto fijo 'R' donde se recibe la luz. (T y R no se muestran en la imagen; T y R pueden estar arbitrariamente lejos).

Concediéndose que el frente de onda es perpendicular a la dirección de propagación: se sigue que el ángulo β 1 es igual al ángulo α 1 , y que el ángulo β 2 es igual al ángulo α 2 .

La variación del camino de la luz consiste en mover el punto S a lo largo de la línea de refracción. Quiero encontrar el criterio que identifique la ubicación del punto S en el espacio de variación tal que se cumpla la ley de Snell.

(2.3) es otra forma de enunciar la ley de Snell:

(2.3) pecado ( α 1 ) v 1 = pecado ( α 2 ) v 2

Configuré expresiones para pecado ( α 1 ) y pecado ( α 2 ) según (2.2):

(2.4) pecado ( α 1 ) = d C 1 d A 1 pecado ( α 2 ) = d C 2 d A 2

A continuación utilizo la suposición de que en cada medio específico la velocidad de la luz es una constante. Para cada medio se fija la relación de distancia y tiempo.

(2.5) C 1 v 1 = T 1 C 2 v 2 = T 2

Combinando (2.3), (2.4) y (2.5):

(2.6) d T 1 d A 1 = d T 2 d A 2

El Diagrama 3 ilustra que cuando el punto 'S' de Snell se mueve los lados A 1 y A 2 cambiar por la misma cantidad. Por lo tanto (2.6) también se puede expresar como derivadas con respecto a la posición del punto 'S'

(2.7) d T 1 d S = d T 2 d S

Que se puede reorganizar de la siguiente manera:

(2.8) d ( T 1 + T 2 ) d S = 0

La derivación anterior explica cómo se produce el tiempo estacionario de Fermat.

La ecuación (2.6) parece como si se tratara del tiempo, pero de hecho (2.6) expresa la relación entre los ángulos β 1 y β 2

La distancia recorrida desde el punto de emisión hasta el punto de Snell es irrelevante, lo que cuenta es el ángulo . (Y, por supuesto, la distancia recorrida desde el punto de Snell hasta el punto de recepción es irrelevante; lo que cuenta es el ángulo).

existe el tiempo total ( T 1 + T 2 ) , pero este tiempo total es solo indirectamente un factor.
El tiempo estacionario de Fermat depende de tomar la derivada del tiempo de viaje con respecto a la coordenada de posición. El significado de la diferenciación: recupera el ángulo porque la diferenciación produce una razón .



¿Lo que da?

Además del caso de un espejo curvo en forma de elipse, también existe el caso de prismas múltiples representado en el diagrama 4

Representación esquemática de una lente Fresnel de imágenes

Diagrama 4, un conjunto de prismas.

En el Diagrama 4, hay tres caminos disponibles para que la luz vaya desde un solo punto de inicio hasta un solo punto final, cada uno con una duración diferente. En el punto final observamos la luz que entra desde tres direcciones; la luz ha tomado los tres caminos. La luz ha tomado el camino con la menor cantidad de tiempo, y el camino con la mayor cantidad de tiempo, y el camino intermedio.

El diagrama 4 ilustra que el criterio de tiempo estacionario de Fermat es en realidad muy permisivo . Solo en algunos casos raros, el tiempo estacionario de Fermat proporciona una restricción suficiente para dar una solución única.

En los libros de texto de física: cuando se introduce el criterio de tiempo estacionario de Fermat, el caso que se presenta es siempre el mismo, uno de los raros casos en los que el criterio de tiempo estacionario de Fermat da por casualidad una solución única.


El hecho de que, en general, el tiempo estacionario de Fermat no da una solución única se analiza en el libro "Introducción a la óptica" de Frank L. Pedrotti, Leno M. Pedrotti y Leno S. Pedrotti.

Pedrotti, Pedrotti y Pedrotti ofrecen la siguiente discusión:

Existen situaciones en las que el camino real tomado por un rayo de luz puede representar un tiempo máximo o incluso uno de muchos caminos posibles, todos requiriendo el mismo tiempo. [...] Una declaración más precisa del principio de Fermat, que requiere simplemente un extremo relativo a los caminos vecinos, se puede dar de la siguiente manera: El camino real tomado por un rayo de luz en su propagación entre dos puntos dados en un sistema óptico es tal como para hacer que su camino óptico sea igual, en primera aproximación, a otros caminos muy adyacentes al real.

Supongo que la "declaración más precisa" de Pedrotti es así:
cuando encuentre un caso en el que haya varias rutas disponibles: divida el espacio en subsecciones , de modo que cada subsección contenga solo una ruta . Luego, dentro de cada subsección, el criterio de tiempo estacionario de Fermat encontrará un solo camino .

La estrategia de Pedrotti va en la dirección correcta, pero se necesita más de lo mismo.



Cuando se presenta el tiempo estacionario de Fermat como una forma de explicar la ley de refracción de Snell, se asume tácitamente que el tiempo estacionario de Fermat opera como un criterio global .

Curiosamente: si aplica el tiempo estacionario de Fermat como criterio local , aún obtiene el mismo camino.

Por ejemplo, en el caso representado en el diagrama 1:
Divida la ruta total en subsecciones.
Luego iterar sobre esas subsecciones.

-Todas las subsecciones que no contienen la línea de refracción: el criterio de tiempo estacionario de Fermat da una línea recta para el camino en esa subsección, alineada con las subsecciones adyacentes.
-En el único subapartado que contiene la línea de refracción: aplicar localmente el criterio de tiempo estacionario de Fermat .

La combinación de aplicar localmente e iterar produce el resultado que satisface la ley de Snell.


A modo de comparación, permítanme presentar cómo Jacob Bernoulli abordó el problema de Brachistochrone.

El desafío Brachistochrone fue emitido en la década de 1690 por Johann Bernoulli, el hermano menor de Jacob Bernoulli. En ese momento, Jacob Bernoulli estaba entre los pocos matemáticos capaces de resolver el problema de la braquistocrona.

El desarrollo del cálculo de variaciones se produjo mucho más tarde, en la década de 1780, por lo que Jacob Bernoulli no tenía cálculo de variaciones ni ningún precursor del mismo.


Jacob Bernoulli reconoció una característica crucial del problema de la braquistocrona y la presentó en forma de lema:

lema de jacob

Sea ACEDB la curva deseada a lo largo de la cual cae un punto pesado de A a B en el menor tiempo, y sean C y D dos puntos tan próximos entre sí como queramos. Entonces el segmento de arco CED es entre todos los segmentos de arco con C y D como puntos finales el segmento que un punto pesado que cae de A atraviesa en el menor tiempo. De hecho, si otro segmento del arco CFD fuera atravesado en un tiempo más corto, entonces el punto se movería a lo largo de AGFDB en un tiempo más corto que a lo largo de ACEDB, lo cual es contrario a nuestra suposición.

( Acta Eruditorum , mayo de 1697, pp. 211-217)

Cada subsección de la braquistocrona es en sí misma una instancia del problema de la braquistocrona. Por lo tanto, la siguiente estrategia funcionará:
divida la curva en una concatenación de subsecciones y establezca una ecuación que sea válida al mismo tiempo para todo el conjunto de subsecciones concatenadas. Tome el límite de subsecciones infinitesimalmente cortas.

Generalizando:
Para que la derivada de X 2 X 1 ser cero: dividir el dominio en subsecciones concatenadas, y establecer la condición: para cada subsección la derivada de la integral correspondiente debe ser cero al mismo tiempo. Tome el límite de subsecciones infinitesimalmente cortas.


La forma de proceder es renunciar a la suposición tácita de que el tiempo estacionario de Fermat opera como un criterio global .

El tiempo estacionario de Fermat opera localmente , operando simultáneamente en un conjunto concatenado de subdivisiones del camino.


En una respuesta de octubre de 2021, discutí cómo se aplican las consideraciones anteriores en el caso de la acción estacionaria de Hamiltons