¿Por qué el Principio de Acción Mínima?

Seré generoso y diré que podría ser razonable suponer que la naturaleza tendería a minimizar, o tal vez incluso maximizar, la integral a lo largo del tiempo de T V . Bien vale. Escribes el funcional de acción, requieres que sea un mínimo (o un máximo) y llegas a las ecuaciones de Euler-Lagrange. Excelente. Pero ahora quiere que estas ecuaciones de Euler-Lagrange no solo sean derivables del Principio de acción mínima, sino que también quiere que sean equivalentes al Principio de acción mínima. Después de pensarlo por un rato, te das cuenta de que esto implica que el Principio de Acción Mínima no es realmente el Principio de Acción Mínima: es el "Principio de Acción Estacionaria". Tal vez sea solo yo, pero por más generoso que sea, no le concederé que sea "natural" suponer que la naturaleza tiende a elegir el camino que es el punto estacionario de la acción funcional. Sin mencionar que ni siquiera es obvio que exista tal camino, o si lo hay,

Pero los problemas no se detienen ahí. Incluso si acepta el "Principio de la acción estacionaria" como fundamental y universalmente cierto, se da cuenta de que no todas las ecuaciones de movimiento que le gustaría tener son derivables de esto si se restringe a un Lagrangiano de la forma T V . Por lo que puedo decir, a partir de aquí es cuestión de jugar hasta que obtengas un Lagrangiano que produzca las ecuaciones de movimiento que deseas.

Desde mi punto de vista (quizás ingenuo), no hay nada particularmente natural (aunque debo admitir que es bastante útil) en la formulación de la mecánica clásica de esta manera. Por supuesto, esto no sería tan importante si estas ideas clásicas permanecieran con la física clásica, pero estas ideas son absolutamente fundamentales para nuestra forma de pensar sobre cosas tan modernas como la teoría cuántica de campos.

¿Podría alguien por favor convencerme de que hay algo natural en la elección de la formulación lagrangiana de la mecánica clásica (no me refiero en comparación con la formulación hamiltoniana; me refiero a punto ), y de hecho, que es tan natural que ni siquiera se atreven a abandonar estas ideas?

posible duplicado del principio de Hamilton
La ecuación de Lagrange se descubrió originalmente sin el principio de acción mínima y se puede derivar directamente de la formulación newtoniana de la mecánica. Goldstein lo hace de esa manera (y tiene una discusión sobre la historia de los principios estacionarios en la física clásica).
Si bien puedo ver cómo esto podría considerarse un duplicado de la otra pregunta, está bien escrito y está obteniendo una buena respuesta, por lo que no me siento particularmente obligado a cerrarlo en este momento.
Un nuevo artículo que intenta responder a tales preguntas: motls.blogspot.com/2011/10/…
“¿Es acción mínima o estacionaria ?” Has dicho, solo se requiere que esté estacionario . Está ahí en Wikipedia. Sin embargo, después de buscar algunos ejemplos en la naturaleza, te das cuenta de que tiende a seleccionar el mínimo esfuerzo o la forma fácil. Pregúntate a ti mismo: “Si alguien me propusiera dos formas legales y morales de enriquecerme, solo diferenciándose por que una es más difícil que la otra. ¿Elegiría el camino difícil?” Las plantas podrían crecer oblicuamente maximizando el estrés sobre su base. En cambio, son propensos a crecer verticalmente minimizando eso.
Históricamente, el descubrimiento del principio se inspiró en el principio de Fermat que dice que la luz recorre el camino más corto posible entre dos puntos. Las partículas masivas no obedecen a este principio, sino a un principio similar, que es el principio de la acción estacionaria.
Hoy en día, podemos entender de dónde viene el principio. Las partículas pueden seguir cualquier camino entre dos puntos fijos, pero el camino con acción estacionaria es el más probable. Esta interpretación proviene de la formulación integral de caminos de la mecánica cuántica. Las partículas clásicas son grandes y, por lo tanto, el camino con acción estacionaria es muy probable. Para obtener una explicación sencilla, visite physicstravelguide.com/advanced_tools/path_integral
@LubošMotl El artículo no es accesible. ¿Tienes algún otro enlace a eso en caso de que hayas migrado tu blog?
No, lo siento, hice que no estuviera disponible permanentemente.

Respuestas (10)

¿Podría alguien convencerme de que hay algo natural en la elección de la formulación lagrangiana...

Si le pregunto a un estudiante de física de secundaria: "Estoy balanceando una pelota con una cuerda alrededor de mi cabeza en un círculo. La cuerda está cortada. ¿Hacia dónde va la pelota?", probablemente me dirá que la pelota sale recta. - a lo largo de la dirección en la que apuntaba la cuerda cuando se cortó. Esto no está bien; la bola en realidad sigue una tangente al círculo, no un radio. Pero el estudiante principiante probablemente pensará que esto no es natural. ¿Cómo pierden este instinto? Probablemente no por una explicación súper impresionante. En cambio, es analizando más problemas, viendo los principios aplicados en situaciones nuevas, aprendiendo a aplicar esos principios y gradualmente, en el transcurso de meses o años, construyendo lo que un estudiante universitario considera una intuición común.

Así que supongo que no, nadie puede convencerte de que la formulación de Lagrange es natural. Te convencerás de eso a medida que continúes estudiando más física, y si esperas estar convencido de todo a la vez, te sentirás decepcionado. Es suficiente por ahora que entiendas lo que te han enseñado, y es bueno que estés pensando en ello. Pero dudo que alguien pueda cambiar rápidamente de opinión. Tendrás que cambiarlo por ti mismo con el tiempo.

Dicho esto, creo que la forma más intuitiva de abordar los principios de acción es a través del principio del tiempo mínimo (es decir, estacionario) en óptica. Pruebe el QED de Feynman , que da una buena razón para creer que el principio del tiempo estacionario es bastante natural.

Puede ir más lejos matemáticamente aprendiendo la formulación de la integral de trayectoria de la mecánica cuántica no relativista y viendo cómo conduce a una alta probabilidad de trayectorias de acción estacionaria.

Más importante aún, solo use la mecánica de Lagrangian tanto como sea posible, y no solo encuentre ecuaciones de movimiento para veinte sistemas diferentes. Úsalo para hacer cosas interesantes. Aprenda a ver la relación entre las simetrías y las leyes de conservación en el enfoque lagrangiano. Aprende sobre la relatividad. Aprenda a derivar el electromagnetismo a partir de un principio de acción, primero estudiando el Lagrangiano de una partícula en un campo electromagnético y luego estudiando el propio campo electromagnético descrito por una densidad de Lagrange. Trate de explicárselo a alguien; sus preguntas agudizarán su comprensión. Consulte las conferencias de Leonard Susskind en YouTube (especialmente las series 1 y 3). Son la fuente más intuitiva que conozco para este material.

Lea algunas de las muchas preguntas aquí en las etiquetas Lagrangian o Noether . Vea si puede descifrar sus respuestas, luego lea las respuestas que las personas han proporcionado para compararlas.

Si pensaba que el enfoque lagrangiano era incorrecto, es posible que desee que alguien lo convenza de lo contrario. Pero si todavía no te sientes cómodo con él, te estarías privando de un gran placer al no tomarte el tiempo para aprender sus complejidades.

Finalmente, su pregunta es muy similar a esta , así que revise las respuestas allí también.

Hermosa respuesta. Me recuerda la respuesta del Rambam a la petición de explicar la Torá estando parado sobre un pie. "No hagas a los demás lo que es odioso para ti. El resto es comentario. Ahora ve a estudiar".
Una respuesta filosófica pero buena. ;-)
"En matemáticas no entiendes las cosas. Simplemente te acostumbras". Juan von Neumann
No veo por qué uno necesita analizar muchos problemas para ver que la pelota va tangencialmente como la cuerda está cortada. Una persona racional lo conseguirá inmediatamente de una sola vez porque existe una prueba rigurosa y directa de la afirmación de que la pelota irá tangencialmente. Desarrollar una intuición de las cosas basada en tu experiencia y no en pruebas rigurosas es adoptar una religión y no hacer ciencia matemática real.

La intuición del principio de Lagrange proviene de aplicaciones específicas de las leyes de Newton, especialmente sistemas reversibles con restricciones, como partículas no esféricas que ruedan a lo largo de superficies complicadas. La formulación de las leyes de Newton por parte de Newton no fue el final de la historia, porque había más estructura en las soluciones de este tipo de problemas de lo que Newton hizo evidente.

Una cosa que Newton no dijo es la conservación de la energía. Los procesos elásticos son más fundamentales que los inelásticos. Pero la conservación de la energía es sólo una parte de la historia. Suponga que tiene un montón de masas conectadas por resortes y una de ellas está unida a un péndulo doble. En teoría, podría tener conservación de energía en un sistema de este tipo al hacer que toda la energía se escape de las masas en los resortes y entre en el péndulo doble. Tal vez cada movimiento sin fricción de los resortes eventualmente asiente toda la energía en un solo modo.

Tu intuición probablemente se esté rebelando, diciéndote "¡eso es infinitamente improbable! ¡Cómo podría el péndulo moverse y no hacer vibrar los resortes!" Pero no hay nada en las leyes de Newton por sí mismas, incluso con el principio de conservación de la energía, que impida este tipo de concentración de energía. Pero las soluciones no exhiben tales fenómenos, y debe haber una razón para ello.

Esta intuición te dice que un sistema mecánico perfecto sin fricción es más que conservador de energía, debe conservar alguna noción de "volumen de movimiento", de modo que si alteras el estado inicial en cierta cantidad, el estado final debería alterarse de la misma manera. . No puede concentrar todo el movimiento en un solo modo. Este principio es el principio de conservación del volumen del espacio de fase, o la conservación de la información. Si todo el movimiento se concentrara en un modo, la información sobre dónde estaba todo tendría que comprimirse absurdamente en una diminuta región del espacio de fase, el espacio de todos los movimientos posibles.

La conservación de la información es tan fundamental como las leyes del movimiento de Newton: está revelando nuevos hechos sobre la naturaleza que son esenciales para la descripción de los sistemas estadísticos y cuánticos. Pero no se encuentra en ninguna parte de la formulación de Newton, porque no se sigue de las leyes de Newton solamente, incluso con el principio de conservación de la energía añadido.

Por lo tanto, debe comprender qué tipo de ley le dará una ley de conservación de la información. Hay dos caminos para descender, y ambos conducen a la misma estructura, pero desde dos puntos de vista diferentes, local en el tiempo y global en el tiempo.

Un camino es hamiltoniano: considera formular la ley del movimiento como un conjunto de ecuaciones simplécticas para la posición y el momento. Esta formulación separa claramente entre dinámica reversible e irreversible, porque solo funciona para reversible. También explica la estructura matemática fundamental detrás de la mecánica clásica reversible, la geometría simpléctica. El volumen de la geometría simpléctica da la ley precisa de la conservación de la información y, además, se aclara la estructura geométrica de los sistemas con soluciones multiperiódicas, los sistemas integrables.

Pero este punto de vista se centra en una división del tiempo: describe cosas que van de un instante de tiempo a otro. Esto no está jugando muy bien con la relatividad. Entonces, también desea pensar en la solución globalmente y considerar el espacio de todas las soluciones como el espacio de fase. La posición inicial y las velocidades son buenas coordenadas, e intuitivas, porque determinan el futuro. Pero si desea una imagen global, desea coordenadas que sean simétricas entre el estado final y el inicial, ya que la dinámica es reversible. Una descripción reversible explícita debe tratar el tiempo inicial y el tiempo final de forma simétrica. Así se pueden utilizar las posiciones iniciales y las posiciones finales, que además, genéricamente, lejos de ciertas malas elecciones, determinan el movimiento.

Para este tipo de coordenadas en el espacio de fase, se da la ley dinámica como condición de la trayectoria entre las posiciones inicial y final. La condición no debe establecerse como una ecuación diferencial, porque tal descripción no es natural para condiciones de contorno de este tipo. Pero cuando tienes un principio de acción, determinas la trayectoria al extremar la acción entre los puntos finales, automáticamente tienes una noción del volumen del espacio de fase, que es intuitivo --- el volumen del espacio de fase se define por el cambio en la acción de trayectorias extremas con respecto a los cambios en las velocidades iniciales. Este volumen es el mismo que para los cambios de las trayectorias extremas con respecto a los cambios en las velocidades finales. Esta es una consecuencia directa de la equivalencia de la formulación lagrangiana y hamiltoniana.

La justificación completa de ambos principios viene solo con la mecánica cuántica. Allí aprendes que el principio de mínima acción es un principio de Fermat de óptica geométrica para ondas de materia, y dice que las trayectorias son perpendiculares a las líneas de fase constante. Pero históricamente, se reconoció que la formulación lagrangiana era más fundamental un siglo antes de que Hamilton conjeturara que la mecánica clásica era una mecánica ondulatoria, y esto fue muchas décadas antes de Schrödinger. Aún así, con nuestro punto de vista moderno, no está de más aprender primero la versión cuántica de estas formulaciones, y ciertamente proporciona una motivación más sólida que las consideraciones heurísticas que di anteriormente.

¿A qué te refieres con conservación de la información?
@Self-MadeMan: cuando no conoce las condiciones iniciales, coloca una distribución de probabilidad ρ en estos, entonces evolucionas ρ mediante la evolución de las condiciones iniciales de acuerdo con las leyes de Newton. Entonces la información que falta en la ignorancia codificada de la distribución de probabilidad ρ , que hasta una constante log-divergente infinita (dependiendo de la discretización del espacio de fase), ρ Iniciar sesión ρ d X d pags sobre el espacio de fase, es constante. Esta es la ley de conservación de la entropía del siglo XIX en la mecánica reversible clásica, descubierta básicamente por Boltzmann/Lorschmidt, el teorema de Liouville.
@RonMaimon: ¿Puede profundizar en el razonamiento del formalismo de Lagrange, o conoce algunos textos sobre este tema en particular? ¿Por qué una trayectoria (que es una solución) es un elemento del espacio de fase?

OP escribió:

Por lo que puedo decir, a partir de aquí es cuestión de jugar hasta que obtengas un Lagrangiano que produzca las ecuaciones de movimiento que deseas.

Con demasiada frecuencia, como estudiante, a uno solo se le muestra cómo derivar la segunda ley de Newton a partir de las ecuaciones de Euler-Lagrange postulando algún Lagrangiano particular. L . Si uno cree que las leyes de Newton son más naturales (dentro del contexto de la mecánica clásica no relativista), entonces tal vez sería más satisfactorio ver una derivación en la otra dirección, es decir, ver ecuaciones de Lagrange derivadas de las leyes de Newton. Esto se hace, por ejemplo, en el primer capítulo de Herbert Goldstein, Classical Mechanics, cf. por ejemplo , esta publicación de Phys.SE. (Un elemento importante en esta derivación es mostrar que una gran clase de fuerzas de restricción no realizan trabajo virtual , lo que lleva al principio de D'Alembert ).

Lanzando una llave en las obras, permítanme finalmente mencionar que existen ecuaciones de movimiento que no tienen principio de acción, cf. por ejemplo , esta publicación de Phys.SE.

(+1) ¿Hay una buena publicación en este sitio o algún artículo sobre la equivalencia de las ecuaciones de Lagrange, el principio de Hamilton y la segunda ley de Newton?
Por lo tanto, satisfacer las ecuaciones de Newton es equivalente a ser mínimos de la integral de acción.
Sí.

Aquí está, por fin, mi propio intento de solucionar este problema.

Para entenderlo, primero tenemos que, como con muchas cosas, dar un paso atrás. No deberíamos interesarnos tanto en un principio por la forma del Lagrangiano cuanto por su objetivo , que es este:

El Lagrangiano nos permite describir el movimiento como un proceso de optimización.

Ahora, ¿por qué querríamos hacer eso? La respuesta es simple: muchoslas cosas en el mundo involucran alguna forma de proceso de optimización, a través de muchos, muchos dominios. Uno familiar de la física que probablemente haya encontrado directamente en su vida es el de una película de jabón. Toma la forma que toma porque busca la energía mínima, o la distribución de fuerzas más equitativa. Si estuvieran desequilibrados, lo llevarían a una forma diferente hasta que se lograra ese equilibrio. Las formas de los planetas son otro ejemplo: por eso son todos (casi)esferas: esa forma, de nuevo, optimiza la energía potencial. En la civilización humana, también tratamos de buscar lo óptimo en muchas cosas: por ejemplo, tendemos a querer encontrar la solución menos costosa para cualquier problema, por mucho mejor o peor que sea. Esto, probablemente, también tiene sus raíces en última instancia en la optimización biológica de nuestra psicología o mejor dichomezcla psicocultural , a través del proceso de evolución, optimizando para el éxito reproductivo.

Estos ejemplos deberían convencerlo de que ver las cosas en términos de búsqueda de óptimos es algo muy razonable que desear hacer y, por lo tanto, podríamos preguntarnos si el movimiento podría o debería tratarse como tal en algún sentido: ¿hay algún sentido en el que podemos decir que los objetos se mueven en los caminos que siguen porque son, en este sentido, "óptimos"? Puede ser que no la haya, o que no nos diga nada esclarecedor, pero por otro lado, puede ser que la haya.

Y el Lagrangiano es la respuesta a eso, aunque no es 100% satisfactorio porque el camino que se toma no tiene por qué ser estrictamente el camino de mínima acción. Lo integramos, nos da una especie de "costo", por así decirlo, que luego se optimiza (parcialmente) y nos da la ruta de movimiento "correcta" que toma "realmente" un objeto. Por supuesto, eso aún deja abierta la pregunta de por qué toma la forma bastante extraña.

L ( q , q ˙ , t ) := k ( q ˙ ) tu ( q , t )

para que la acción sea

S [ γ ] := t i t F L ( γ ( t ) , γ ˙ ( t ) , t )   d t

sobre una trayectoria de movimiento potencial paramétrica γ , más allá de simplemente "bueno, reproduce los movimientos que vemos". Si bien, y volveré a esto al final, no sería una sorpresa si eso, dado que este es un marco general, para fenómenos bastante complejos y oscuros, podría no haber una interpretación directa, la primera exposición de uno a este concepto todavía está en el contexto de la mecánica newtoniana básica y, por lo tanto, debería haber al menos alguna forma de hacerlo intuitivo para dar una base sobre la cual construir esos conceptos y aplicaciones más complejos.

Y esta es la mejor respuesta que se me ocurrió. Dado que estamos viendo el movimiento como una optimización del camino recorrido en términos de un "coste", buscaremos idealmente su minimización, dado que generalmente por intuición tendemos a pensar en términos de ahorro, no en términos de gasto, cuando viene a la "mejora" de hacer algo. Con ese fin, consideremos algo más con lo que, con suerte, muchas personas deberían estar familiarizadas al menos en algún nivel: a saber, el costo monetario requerido para transportar un paquete de bienes de un punto a otro en la superficie de la Tierra. En particular, podemos imaginarnos transportar la mercancía en un vehículo terrestre como un camión o un tren, y cuando lo hacemos, generalmente encontramos que al menos cuatro factores influyen en el costo, así:

  1. La masa de la carga: las cargas más pesadas son más caras de transportar y, por lo general, el transporte se suele facturar por masa,
  2. La distancia sobre la que se transporta: cuanto más necesitamos moverlo, más caro (por ejemplo, más combustible, más riesgo, más pago para el conductor, etc.),
  3. El tiempo de transporte: si requerimos que se entregue rápido , espere pagar una prima (mejores vehículos, debe elegir las rutas de envío correctas, el conductor debe permanecer despierto más tiempo tal vez...),
  4. Las condiciones del transporte: si el transporte requiere sortear las inclemencias del tiempo, un terreno desafiante u otros factores similares, espere, nuevamente, un costo adicional al menos en algún momento de la línea.

Y resulta bastante interesante que, al menos en casos simples, podemos, sorprendentemente, interpretar el Lagrangiano "extraño" prácticamente de la misma manera :

La acción es el "precio" que la Naturaleza pagará por acarrear sus bienes.

Para hacer eso, primero tenemos que reducir un poco nuestra atención y luego reescribirlo de una forma que un físico, al menos entrenado en el "modelo" estándar, pueda encontrar peculiar, pero que sea matemáticamente 100% kosher. El estrechamiento de nuestra atención es básicamente al caso de una sola partícula, y usamos las coordenadas usuales para el movimiento. En esta configuración, el principio de acción toma la forma, que puede verificar, del negocio (opaco) "cinético menos potencial",

S [ γ ] = t i t F ( 1 2 metro [ γ ˙ ( t ) ] 2 ) tu ( γ ( t ) )   d t

que luego podemos reescribir como

S [ γ ] = t i t F ( 1 2 metro [ γ ˙ ( t ) ] 2 )   d t + t i t F [ tu ( γ ( t ) ) ]   d t

Ahora, tenga en cuenta el siguiente truco: γ ˙ = d γ d t es solo la velocidad, v ( t ) , un vector, ya que es la derivada temporal de la ruta en coordenadas ordinarias, por configuración. Su cuadrado es pues el cuadrado de la velocidad: [ v ( t ) ] 2 , donde la velocidad v es igual d s d t , la velocidad a la que la longitud del arco ( s ) se cubre a medida que transcurre el tiempo. Usar eso nos permite transformar la primera integral en:

t i t F ( 1 2 metro [ γ ˙ ( t ) ] 2 )   d t = 1 2 metro ( t i t F d s d t [ d s d t   d t ] )

que mediante la "mezcla desvergonzada de diferenciales" (es decir, la regla de la cadena y el cambio de variable) se convierte en

1 2 metro ( 0 d t o t v ( s )   d s )

(Nota si s es una función de t , d s se convierte s   d t , y v ( s ( t ) ) es solo v ( t ) , que es justo lo que teníamos antes).

dónde d t o t = d t r a v es la distancia total recorrida durante el movimiento completo y hemos cambiado a medir el progreso del movimiento en términos de la distancia recorrida hasta el momento. Aún más sugerentemente, observando la definición habitual de promedios del cálculo, podemos reescribir el término cinético anterior y, por lo tanto, toda la acción, a través de la velocidad promedio ,

S [ γ ] = 1 2 metro v a v gramo d t r a v + t i t F [ tu ( γ ( t ) , t ) ]   d t

Además, podemos hacer lo mismo para el término potencial de la derecha usando el potencial promedio encontrado y el tiempo de viaje. t j o tu r norte := t F t i :

S [ γ ] = 1 2 [ metro v a v gramo d t r a v ] + [ tu a v gramo t j o tu r norte ]

Y vemos que esta expresión, entonces, muy, muy bien se alinea con las intuiciones que acabamos de discutir sobre el costo del transporte: el primer término es básicamente el costo del movimiento, es decir, el costo inherente a moverse una cierta distancia a una cierta velocidad. El costo aumenta en proporción a la masa transportada, la velocidad del transporte y la distancia: exactamente como podríamos pensar (aunque en nuestro mundo humano la relación rara vez es tan simple como una proporcionalidad exacta como esta, pero tal es la elegancia de principios básicos del universo). Además, entra en juego el significado del término potencial, y ese molesto signo menos: este término aborda el cuarto factor (por eso lo elegí, porque lo resolví antes de escribir esta publicación), que es el medio ambiente. , o quizás, "costo del terreno". Recuerde que, a menos que nuestra partícula se encuentre en un espacio intergaláctico profundo, libre de prácticamente todas las demás influencias, estará sujeta a las acciones de fuerzas que competirán para influir en su movimiento.permanezca el menor tiempo posible a la menor profundidad posible en cualquier pozo atractivo ", o en términos de costo, que se le "facturará" más por permanecer más tiempo y más profundo. La razón del signo negativo es solo eso: a medida que un pozo de potencial se hace más profundo, su potencial disminuye . Para que esa profundidad más profunda cueste más , debemos cambiar el signo del potencial, de modo que sea negativo. Tal vez no sea exactamente cómo estableceríamos el costo, pero debería ser comprensible y sensible a su manera.

En tanto ¿por qué (intuitivamente) un punto estacionario y no siempre un mínimo? Bueno, no siempre podemos obtener lo más barato que querríamos en cada situación, pero podemos obtener algo que es un poco barato; al menos, si algo sale un poco mal y tenemos que tomar un pequeño desvío, no debería doler. el costo demasiado.

Por supuesto, como dije, todo esto es por un caso relativamente simple. Y sí, a medida que llega a casos más complicados y fenómenos físicos más difíciles, se vuelve menos claro cómo se relaciona la acción con la forma en que contabilizaríamos el costo, pero eso no es una sorpresa: ahora no estamos lidiando con puntos simples. movimiento de punto. El propósito de este ejercicio es primero obtener la intuición básica de que la acción es un costo de movimiento .- y esto es algo que puede ser familiar para cualquiera que haya jugado ciertos juegos de rol: muy a menudo, esta noción de "costo de acción" encuentra su camino allí. Naturalmente, para describir otros fenómenos más complicados, tenemos que definir la acción de manera diferente, describiéndola en términos de costos distintos a estos. Esto no es diferente de trabajar en términos de fuerzas, donde la intuición es presumiblemente algo más clara. Por ejemplo, en electromagnetismo (aunque es posible que no haya entendido bien esta parte), podemos describir de manera similar la acción como tener que combinar y contabilizar de manera apropiada los costos de construir y/o derribar un campo electromagnético, la tasa de dicha construcción y/o demolición, y el costo de mantenimiento de mantener un campo distinto de cero.

Y eso, finalmente, responde a su pregunta de, esencialmente, cómo "piensa" en la mecánica lagrangiana para obtener el resultado correcto y no desviarse: sí, es un marco diferente, y desafortunadamente, como en muchos casos de Al tratar con marcos novedosos, parece que el enfoque dominante es usarlo esencialmente "por conversión" (problema similar al de enseñar a los estadounidenses el sistema métrico, o enseñar un idioma extranjero mediante la traducción o relación de palabras/frases con su idioma nativo , o cualquiera de una serie de otras instancias de esta falla común que simplemente no me vienen a la cabeza en este momento) en lugar de "en sus propios términos". Para usarlo realmente de manera competente, esencialmente tiene que darle un empujón a la noción de "fuerzas" y pensar de nuevo, desde el principio,en cambio: qué acciones ocurren aquí y qué puede impedirlas o facilitarlas (por ejemplo, sumergirse en un pozo potencial), y cuáles son las fórmulas correctas para describir los costos que tienen esas acciones. Por lo tanto, si hubiéramos seguido este camino desde el principio, por ejemplo, si Newton hubiera tenido el pensamiento de un economista o proveedor de servicios que busca mejorar la productividad, podría haber comenzado postulando que el movimiento constante lineal, es decir, sin pozos potenciales, tendría un costo lineal. fórmula. (Y entonces habría tenido que desarrollar primero el cálculo de variaciones , mientras que en su lugar tratamos el cálculo instantáneo como primario... Me pregunto cómo habría influido eso en el desarrollo de las matemáticas .... tantos caminos no tomados, a lo largo de la historia, ¿a dónde podrían ir? ¿Qué posibilidades acechan allí? Me pregunto ...)

En conclusión, vemos que, como dijo Maupertuis (quien formuló un principio de acción algo más débil antes del Principio de Hamilton), en efecto,

La naturaleza es ahorrativa en todas sus acciones.

pero con nuestra comprensión más sofisticada, tal vez deberíamos persuadirlo gentilmente de:

La naturaleza prefiere el ahorro en la acción, excepto cuando la necesidad la obligue a gastar más, en cuyo caso, lo mejor será lo siguiente.

(Una cosa más: puede preguntar por qué hay un 1 2 término, desde este punto de vista, en el término cinético [coste de la acción motriz]. Una forma de decirlo podría ser que a la Naturaleza le gusta hacer que el terreno sea el doble de importante que el movimiento, pero debe tener en cuenta que con una selección adecuada de unidades, el término puede desaparecer: podríamos medir en medias unidades de masa, o en unidades dobles de energía, teniendo en cuenta que esto puede parecer que rompe la coherencia de cómo se definen normalmente estas unidades. Sin embargo, también podríamos, entonces, tal vez que eso esté "sobre nosotros" en el sentido de que derivamos nuestras unidades de energía a partir de consideraciones de fuerza como primarias: recuerde que un "julio" es "un Newton de fuerza por un metro de distancia". De hecho, si tuviéramos que tomar lagrangianacomo primaria, lo que puede tener más sentido dado su papel más fundamental, podemos buscar que la unidad de energía sea "la energía que 'hace las cosas' a razón de una unidad de acción por unidad de tiempo", y definir masa como necesitemos como una cantidad separada. De hecho, con esta elección hecha, finalmente llegamos a la formulación "tan difícil", para la mecánica newtoniana en el caso de las fuerzas conservativas:

"Costo de acción" i s Masa para mover     t i metro mi s     Distancia de transporte     t i metro mi s     Velocidad requerida pags yo tu s Costo de negociación de obstáculos     t i metro mi s     Tiempo de negociación de obstáculos

Casi tan fácil como F = metro a !)

Buena explicación. Una cosa que me molesta es por qué, desde el punto de vista de la acción, la optimización es (en sus palabras) "permanecer el menor tiempo posible a la menor profundidad posible en cualquier pozo atractivo", sin embargo, los proyectiles hacen exactamente lo mismo. contrario, caen al pozo lo más rápido posible en lugar de caer o mantener su altura. ¿Alguna idea sobre esto?
@MajorChipHazard: creo que ahora tengo una mejor manera de poner esta parte. Al describir el movimiento bajo el paradigma de la acción, no solo estamos hablando de que el objeto encuentre la ruta de acción más baja posible de todas las disponibles. Más bien, estamos hablando de encontrar un camino dadas algunas restricciones: hay un origen preestablecido, un destino preestablecido, una velocidad inicial preestablecida, una velocidad final preestablecida y, finalmente, un tiempo requerido para completar el viaje. Debido a que la velocidad es una función de la ruta, efectivamente desaparece, dejando solo el origen, el destino y el tiempo requerido para terminar el viaje.
Y si los puntos inicial y final tienen un costo de terreno más bajo y más alto, respectivamente, el objeto tiene que llegar a un punto de costo más alto, tiene que profundizar en el pozo por definición. La única pregunta es cómo lo hará, y la forma más eficiente es ir directamente al pozo, acumulando velocidad para compensar el costo de residencia por el costo de movimiento al reducir el tiempo de residencia en cualquier área (que es cada vez más). caro). Girar en espiral no sería eficiente, porque pasa mucho tiempo en (si el pozo es esféricamente simétrico) un terreno de residencia similar que cuesta cada espiral.
Del mismo modo, si los puntos inicial y final están en terreno del mismo costo pero en lados opuestos del pozo, entonces sí, se doblará alrededor del pozo. Ahora no se está haciendo para ir a un punto de mayor costo, por lo que trata de evitar la región de mayor costo. Así es como funciona una órbita.
Entonces, de hecho, se comporta como usted esperaría que lo hiciera, solo que necesita pensar un poco más globalmente en el sentido de que debe imaginar tanto el punto inicial como el final del viaje como ya se ha dado. No debes pensar directamente en términos de lanzar el proyectil. En su lugar, piense en planificar el disparo: tiene su arma en una posición determinada, desea alcanzar un objetivo en otro y desea que su bala llegue allí en un tiempo determinado después del disparo (digamos, 1 segundo). El principio de acción dice cuál es la ruta físicamente posible y el perfil de velocidad que hará eso.
Cuando estás pensando en tirarlo, la intuición es menos clara porque esa es una operación local . Los dos son, por supuesto, equivalentes porque las matemáticas de las ecuaciones diferenciales le permiten convertir el punto inicial/final más la restricción de tiempo en una velocidad inicial más, pero al pensar en el principio de acción necesita pensar en los puntos inicial y final como variables independientes.

El punto principal de la formulación lagrangiana de la mecánica clásica era deshacerse por completo de las relaciones de restricción para que uno no tenga que preocuparse por ellas mientras calcula nada (vea esta respuesta mía . Recuerde que todas las valiosas simetrías de la situación física se incorporan automáticamente en esta formulación de la mecánica.

Ahora, después de tener una técnica tan poderosa a nuestra disposición, es natural hacer una pregunta simple. ¿Puede la teoría clásica del electromagnetismo, es decir, las ecuaciones de Maxwell, expresarse como ecuaciones de Euler-Lagrange definiendo adecuadamente un Lagrangiano del campo electromagnético, de modo que podamos obtener fácilmente todos esos hermosos resultados de la estructura de esta formulación (por ejemplo, evitar las molestas restricciones de campo )? La respuesta es 'sí', siempre que definamos adecuadamente un Lagrangiano.

De hecho, se observa que cualquier ecuación de campo clásica general puede expresarse mediante la ecuación de movimiento de Euler Lagrange y, en cada caso, debe definir un Lagrangiano (obtiene una "Acción" correspondiente) y obtener todo gratis.

Este enfoque lagrangiano es tan poderoso que incluso las teorías cuánticas de campos las explotan por completo y casi todas las teorías modernas de la física las explotan de alguna manera.

Sin embargo, no está del todo claro si este enfoque es completamente general. ¿No puede ser el caso de una teoría futura que las ecuaciones de la teoría no puedan expresarse en la formulación lagrangiana? Hice esta pregunta aquí . Ver algunas buenas respuestas.

¿Qué significa "principio"? Tiene muchas definiciones, pero en el contexto de esta discusión tiene el poder que tiene "axioma" en matemáticas: una suposición muy básica que, si se cambia, toda la teoría del constructo cambia o se destruye.

La física ha adoptado esto a partir de la observación geométrica de que: la distancia más corta entre dos puntos es una línea recta, lo que lógicamente condujo al "tiempo mínimo necesario" y la búsqueda de la distancia más corta cuando se desconoce.

que es tan natural que ni siquiera nos atreveríamos a abandonar estas ideas?

Si alguien lo suficientemente brillante puede presentar otro principio para el sistema de formulación matemática de la mecánica clásica y, posteriormente, la teoría cuántica de campos que no sigue la menor acción pero incorpora perfectamente la gran base de datos / ecuaciones existentes, etc., no hay problema. Incluso podría adoptarse en general si pudiera predecir nuevos resultados espectaculares. De lo contrario, por economía de esfuerzo mental (otro principio :)) el sistema desarrollado bajo el principio de mínima acción aún prevalecerá.

El lagrangiano es solo una antiderivada (especial y funcional) de una ecuación de movimiento. En casos simples, la ecuación de movimiento de partículas clásicas es una función F ( X , X ˙ , X ¨ , . . . ) de las posiciones, velocidades, aceleraciones, etc. de las partículas, para las cuales la ecuación F ( X , X ˙ , X ¨ , . . . ) = 0 determina la trayectoria. Cuando una función F ( . . . ) admite una antiderivada lagrangiana, los máximos y mínimos de la antiderivada lagrangiana determinan dónde encontrar los ceros de la función F ( X , X ˙ , X ¨ , . . . ) , la derivada del lagrangiano.

No hay necesariamente nada fundamental o natural en un Lagrangiano. El lagrangiano tiene muchas propiedades formales que a menudo lo hacen extremadamente útil y, con bastante frecuencia, lo hacen bastante simple o hermoso. Nos gustan las cosas bonitas. Apreciar la belleza es algo complicado, hasta cierto punto es una cuestión de experiencia, hasta cierto punto una cuestión de solo verla. Mark y Anna son guías bastante buenos.

¿Podría alguien convencerme de que hay algo natural en la elección de la formulación lagrangiana de la mecánica clásica?

¡No, porque no es nada natural! ¡Es por eso que se necesitaron cientos de años y dos de las mentes más brillantes de la historia (Lagrange y Hamilton) para lograrlo!

Pero el hecho es que cada régimen de la física -mecánica newtoniana, mecánica de fluidos, electromagnetismo, mecánica cuántica no relativista, física de partículas, teoría cuántica relativista de campos, física de la materia condensada, relatividad general- puede formularse como extremista de alguna acción que es una integral de un Lagrangiano local. (Los sistemas de un número finito de partículas puntuales clásicas que interactúan son posiblemente la única excepción). Entonces, te guste o no la idea, aparentemente la naturaleza sí, y debes aceptarla si quieres entender el universo.

En una nota menos frívola: si está haciendo esta pregunta, probablemente solo haya visto el principio de acción formulado en el contexto de la mecánica newtoniana. En este caso, es mejor para incorporar restricciones de manera eficiente: partículas confinadas para moverse en ciertas superficies, etc. En este contexto, estaría de acuerdo en que sería mejor pensar en las leyes de Newton como más fundamentales que la elección de un Lagrangiano en particular, que generalmente describe un sistema extremadamente específico.

Pero a medida que avanza en el aprendizaje de la teoría de campos y los conceptos de granularidad gruesa, renormalización y universalidad, verá que las propiedades de baja energía de una gran variedad de sistemas que consisten en una enorme cantidad de grados de libertad microscópicos con interacciones locales puede describirse mediante teorías de campo especificadas por una acción. De hecho, prácticamente cualquier sistema puede describirse así, y este tipo de sistemas aparecen en una gran cantidad de contextos diferentes, desde la materia condensada hasta la gravedad cuántica. Todo lo que necesita saber sobre los grados de libertad microscópicos son sus simetrías y quizás algunos datos muy básicos, como si son bosones o fermiones.

De hecho, el consenso general entre muchos físicos en estos días es que prácticamente no tenemos idea de lo que sucede en la escala de Planck, pero podemos dar argumentos bastante precisos y cuantitativos de por qué no importa lo que suceda allí para nosotros. poder usar válidamente la teoría cuántica de campos (¡definida por una acción!) para describir la física en escalas de longitudes que varían en muchos órdenes de magnitud.

PD Tienes toda la razón al decir que el "Principio de Mínima Acción" es simplemente incorrecto. La acción es estacionaria en las configuraciones que satisfacen las ecuaciones físicas de movimiento, pero puede ser un punto máximo, mínimo o de silla. El libro de A. Zee sobre GR contiene un problema que demuestra que incluso para el oscilador armónico simple, la acción a menudo se maximiza en lugar de minimizarse a lo largo de las ecuaciones de movimiento.

"Entonces, te guste o no la idea, aparentemente la naturaleza sí, y debes aceptarla si quieres entender el universo". --- Pero yo diría que entender por qué a la Naturaleza le gusta la idea es parte de entender el universo. Puedo aceptarlo y al mismo tiempo preguntar "¿Por qué?".
@JonathanGleason Ciertamente, pero creo que es más una cuestión de filosofía que de física. En algún momento, debe comenzar con algunos postulados puramente empíricos; de lo contrario, no tiene nada para continuar. Habiendo dicho eso, creo que mis comentarios sobre la teoría de campos y la renormalización brindan una motivación razonablemente buena.

No es una respuesta, pero es demasiado larga para un comentario. Quería mostrar que, terminología aparte, en general una acción estacionaria ni se minimiza ni se maximiza, por lo que en teoría deberíamos hablar del principio de acción estacionaria. Considere el modelo más simple de caída para el cual una unidad de masa tiene Lagrangian z ˙ 2 gramo z por lo que la ecuación de movimiento es z ¨ = gramo . Supongamos que la masa cae desde una altura h por un tiempo τ := 2 h gramo , a saber z = h ( 1 ( t τ ) norte ) por t [ 0 , τ ] con norte = 2 . Reemplacé deliberadamente un exponente con un parámetro libre porque, teóricamente, una masa que cayó desde la misma altura en el mismo período podría usar cualquier norte > 0 si no fuera por la ecuación del movimiento. El punto es que podemos demostrar que norte = 2 ni minimiza ni maximiza la acción obtenida durante el período de caída. Tenemos z ˙ = norte h t norte 1 τ norte asi que

S = 0 τ ( z ˙ 2 gramo z ) d t = 0 τ ( norte 2 h 2 t 2 norte 2 τ 2 norte gramo h + gramo h t norte τ norte ) d t = F ( norte ) h 2 τ
con
F ( norte ) := norte 2 2 norte 1 gramo τ 2 h ( 1 1 norte + 1 ) = norte 2 2 norte 1 2 norte norte + 1 .
De este modo F ( 2 ) = 4 3 4 3 = 0 . Pero como se puede ver en el gráfico de F ( X ) aquí , valores de norte > 0 existir para lo cual F ( norte ) < 0 - para ser precisos, el conjunto de soluciones es ( 0 , 1 2 ) . (La asíntota más a la derecha de F juega un papel en esto.) De hecho, no hay finito norte no en una asíntota minimiza o maximiza F , pero exactamente uno norte > 0 hace F estacionario, a saber norte = 2 .

¡Esto es correcto, lo que me sorprende mucho! ¿Por qué, entonces, se menciona el "Principio de mínima acción" en la literatura? Al ver este ejemplo, esto es completamente incorrecto.

La integral funcional en la mecánica cuántica incluye una suma de todos los caminos posibles en el espacio de configuración que podría tomar un sistema cuántico. Estos caminos están ponderados por una función imaginaria exponencial cuya fase es la acción. Usando el método del descenso más pronunciado, se puede pasar al límite clásico que muestra que las ecuaciones de Euler-Lagrange deberían cumplirse para el camino clásico.

¿Por qué el voto negativo? Tal vez sea un poco breve, pero es perfecto. La razón por la que los rayos de luz siguen un principio de mínimo tiempo y la razón por la que las partículas siguen una trayectoria de mínima acción es precisamente que ambos son aproximaciones de fase estacionaria (las otras se anulan) de una ecuación de onda subyacente.
También esto aclara el 'acertijo' completo de por qué la acción es estacionaria y no un máximo o un mínimo.