¿Por qué los términos de frontera hacen que el principio variacional esté mal definido?

Permítanme comenzar con las definiciones a las que estoy acostumbrado. Dejar I [ Φ i ] ser la acción para alguna colección de campos. Una variación de los campos sobre la configuración del campo. Φ 0 i ( X ) es una familia de configuraciones de campo de un parámetro Φ i ( λ , X ) tal que Φ i ( 0 , X ) = Φ 0 i ( X ) dónde λ ( ϵ , ϵ ) . Tomamos el mapa λ Φ i ( λ , X ) ser diferenciable. En ese caso, la primera variación está definida por

(1) d Φ i ( X ) λ | λ = 0 Φ i ( λ , X ) .

Asimismo, la primera variación de la acción se define como

(2) d I [ Φ i ] d d λ I [ Φ λ i ] , Φ λ i Φ i ( λ , ) .

Ahora, según tengo entendido, el principio variacional es la afirmación de que la configuración del campo físico clásico debe ser Φ i tal que d I [ Φ i ] = 0 para cualquier primera variación d Φ i .

Sucede que la mayor parte del tiempo I [ Φ i ] es la integral sobre el espacio-tiempo de alguna densidad lagrangiana d -forma L [ Φ i ] . Entonces sí METRO tiene algún tipo de límite METRO puede pasar que d I [ Φ i ] tiene términos de contorno que contribuyen a ello.

Ahora, en este artículo los autores dicen que tales términos de frontera hacen que el principio variacional esté mal definido (cf página 61):

Como plantean Regge y Teitelboim, la acción debe poseer derivadas funcionales bien definidas: esta debe ser de la forma d I [ ϕ ] = ( algo ) d ϕ sin términos de límite adicionales que estropeen la derivada. La acción debe ser diferenciable para que el principio extremum tenga sentido.

Esto también se alude en la página de WP sobre el término de gravedad de Gibbons-Hawking-York:

La acción de Einstein-Hilbert es la base del principio variacional más elemental a partir del cual se pueden definir las ecuaciones de campo de la relatividad general. Sin embargo, el uso de la acción de Einstein-Hilbert es apropiado solo cuando la variedad de espacio-tiempo subyacente METRO es cerrada, es decir, una variedad que es a la vez compacta y sin límite. En el caso de que la variedad tenga un límite METRO , la acción debe complementarse con un término límite para que el principio de variación esté bien definido.

El término de frontera aludido anteriormente se introduce exactamente para cancelar un término de frontera que aparece cuando uno varía la acción de Einstein-Hilbert. Así que nuevamente tomo esto como diciendo que si la variación de la acción EH tuviera tal término límite, el principio variacional no estaría bien definido.

Ahora, aunque esto parece algo tan básico, debo confesar que todavía no lo entendí:

  1. Con respecto a la discusión en el artículo vinculado, por la aplicación repetida de la regla de Liebnitz, la variación de la densidad de Lagrange L siempre se puede escribir como

    (3) d L = mi i d Φ i + d Θ ,
    dónde mi i son las ecuaciones de movimiento y Θ es el potencial presimplético. La acción es pues de la forma
    (4) d I [ Φ i ] = METRO mi i d Φ i + METRO Θ ,
    No veo cómo la presencia de Θ nos impide definir mi i como los derivados funcionales.

    Además, para mí, la noción más razonable de diferenciabilidad de la acción es decir que λ I [ Φ λ i ] es una aplicación diferenciable. No veo cómo los términos de los límites afectan esto.

    Entonces, ¿por qué los términos de frontera en d I [ Φ i ] produce derivados funcionales mal definidos? Y en qué sentido esto hace I no diferenciable?

  2. Más importante aún, tanto el artículo como la página de WP sobre el término GHY aluden a que el principio variacional está mal definido si d I [ Φ i ] contiene términos de frontera. Tenemos un mapeo λ I [ Φ λ i ] y buscamos un extremo de tal mapa. No veo cómo el hecho de que d I [ Φ i ] tiene términos de contorno haría que este problema de optimización estuviera mal definido.

    Entonces, ¿por qué los términos de frontera hacen que el principio variacional esté mal definido? En otras palabras, ¿por qué un principio variacional bien definido exige d I [ Φ i ] ser de la forma d I [ Φ i ] = ( algo ) d Φ i como parecen afirmar los autores del artículo?

Respuestas (3)

Si tenemos términos de contorno que no desaparecen, entonces el mapa λ I [ Φ λ i ] no es diferenciable en el siguiente sentido. Usando una notación algo menos sofisticada, sea

I [ Φ λ i : η ] := METRO L ( Φ 0 i ( X ) + λ η ( X ) , Φ 0 i ( X ) + λ η ( X ) ) d 4 X

para alguna función diferenciable arbitraria η . Este mapa es ciertamente diferenciable, y encontramos que

d d λ I [ Φ λ i : η ] | λ = 0 = METRO ( L Φ 0 i m [ L ( m Φ 0 i ) ] ) η ( X )   d 4 X + METRO norte m L ( m Φ 0 i ) η ( X )   d S

dónde norte m son las componentes del vector normal de superficie. Esto es diferenciabilidad en el sentido de Gateaux . Sin embargo, este derivado de Gateaux depende genéricamente de qué η nosotros elegimos.

El objetivo final es exigir que la variación en la acción funcional desaparezca independientemente de nuestra elección de η . Asumiendo que el término de frontera desaparece, esto implica que

METRO mi [ Φ 0 i ] η ( X ) d 4 X = 0 mi [ Φ 0 i ] = 0

Sin embargo, en presencia de los términos de frontera, tal implicación no es posible. Para cualquier configuración de campo particular, la variación en la integral de acción se convierte en

d d λ I [ Φ λ i : η ] | λ = 0 = METRO F ( X ) η ( X ) d 4 X + METRO norte m gramo m ( X ) η ( X ) d S

Para que esto desaparezca por arbitraria η , ambas integrales deben desaparecer o deben cancelarse entre sí. En el primer caso, los términos de frontera no están presentes después de todo, mientras que el último caso no funciona. Para ver esto, imagina que

METRO F ( X ) η ( X ) d 4 X = METRO norte m gramo m ( X ) η ( X ) d S = C 0

para alguna elección de η , y tenga en cuenta que siempre podemos agregar a η una función suave que desaparece en el límite pero tiene soporte en cualquier región del volumen que elijamos. Esto cambiaría la primera integral pero no la segunda, rompiendo así la igualdad. En consecuencia, aunque las dos integrales pueden cancelarse para algunas opciones de η , no es posible que cancelen todas las opciones de η (de nuevo, a menos que ambos desaparezcan en primer lugar).

Peor aún, en cierto sentido, la presencia de los términos de frontera que no desaparecen implica, por razones que se derivan inmediatamente de las anteriores, que se puede hacer que la variación tome cualquier valor en R por la escala apropiada de η .

Uno puede pensar en esto como algo análogo al cálculo multivariable. La existencia de derivadas parciales (Gateaux) de alguna función (la acción funcional) a lo largo de cualquier dirección particular (para la elección arbitraria de η ) no es suficiente para garantizar que el mapa sea diferenciable. En este caso, con miras a nuestro objetivo final de tener un derivado funcional que se desvanezca que, independientemente de η , definimos un funcional como diferenciable si su derivada de Frechet se puede poner en la forma

d d λ I [ Φ λ i : η ] | λ = 0 = METRO mi [ Φ 0 i ]   η ( X ) d 4 X

y defina su derivada funcional como mi [ Φ 0 i ] .


Me gustaría hacer una nota rápida sobre su declaración.

No veo cómo la presencia de Θ nos impide definir mi i como los derivados funcionales.

Hay una buena parte de verdad en lo que dices. De hecho, si todo lo que desea son las ecuaciones de Euler-Lagrange para el campo, entonces podría argumentar que la prescripción formal correcta es variar la acción, descartar cualquier término de contorno y luego exigir que la variación desaparezca. Parece un poco poco elegante, pero le daría las ecuaciones que está buscando.

Sin embargo, uno se encuentra con problemas cuando se mueve al marco hamiltoniano. La ambigüedad en términos de límites conduce a la ambigüedad cuando se trata de definir, por ejemplo, las nociones de energía total de un espacio-tiempo particular. En ausencia de términos superficiales, el hamiltoniano se desvanece para gramo i j , π i j que obedecen a las ecuaciones de movimiento; elegir un término límite equivale a elegir un valor para la integral del hamiltoniano sobre todo el espacio-tiempo, y el término GHY produce la energía ADM.

Aparentemente, estos términos límite también son bastante importantes para la gravedad cuántica, pero esta es un área con la que no estoy familiarizado, por lo que no puedo comentarla de manera inteligente.


Déjame preguntarte algo, dices "Sin embargo, en presencia de los términos del límite, tal implicación no es posible". si exigimos d I [ Φ 0 i ] = 0 wrt cualquier variación, entonces en particular esto se mantendría para soporte compacto η ( X ) . Esto no implicaría

METRO mi [ Φ 0 i ] η ( X ) d 4 X = 0
para todos con soporte compacto η ( X ) y a su vez implicar mi [ Φ 0 i ] = 0 incluso en presencia de términos de frontera? ¿Qué va mal aquí?

Parece que está debilitando el requisito de que la acción sea estacionaria bajo una variación arbitraria al requisito de que la acción solo sea estacionaria bajo variaciones con soporte compacto. Si haces esto, obtienes la implicación (y por lo tanto las ecuaciones EL). Sin embargo, esto significa que está reduciendo el espacio de configuraciones de campo "candidato" a aquellas que son idénticas a la inicial en el límite.

Si no está interesado en ningún tipo de evolución temporal en el límite, está bien; en general, esto es demasiado restrictivo. Uno podría imaginar, por ejemplo, una combinación de condiciones iniciales y ecuaciones de evolución que cambiarían necesariamente el campo en el límite. Imponer condiciones de contorno fijas (Dirichlet) además de las ecuaciones de evolución y esta condición inicial particular no conduciría a ninguna solución.

Para empeorar las cosas, en el caso particular de la gravedad, la densidad lagrangiana en realidad contiene segundas derivadas de la métrica a modo de derivada total

m ( h m v v Φ 0 i )
que es una posibilidad que no consideré en el trabajo que hice arriba. En este caso se sigue que el término de frontera se convierte en

METRO norte m [ gramo m ( X ) η ( X ) + h m v ( X ) v η ( X ) ] d S

En este caso, no sería suficiente mantener fija la variación en el límite; también necesitaríamos mantener fijas sus derivadas. Esto es inaceptable, ya que las ecuaciones de movimiento son en sí mismas de segundo orden; arreglando ambos Φ 0 i y v Φ 0 i en el límite sobredeterminaría genéricamente el sistema, excepto en aquellos casos fortuitos en los que norte m h m v 0 .

Gracias por la gran respuesta ! Déjame preguntarte algo, dices "Sin embargo, en presencia de los términos del límite, tal implicación no es posible". si exigimos d I [ Φ 0 i ] = 0 wrt cualquier variación , entonces en particular esto se mantendría para soporte compacto η ( X ) . Esto no implicaría
METRO mi [ Φ 0 i ] η ( X ) d 4 X = 0 ,
para todos con soporte compacto η ( X ) y a su vez implicar mi [ Φ 0 i ] = 0 incluso en presencia de términos de frontera? ¿Qué va mal aquí?
@ user1620696 Edité mi respuesta para abordar su pregunta.

Aquí hay un comentario. Si adaptamos la definición de OP

(4) d I [ Φ i ] = METRO mi i d Φ i + METRO Θ i d Φ i ,

entonces para el término a granel mi i y el término límite Θ i Para ser definidos de forma única, debemos, para empezar, imponer que no son operadores diferenciales de orden distinto de cero (que actúan sobre d Φ i ) sino solo funciones (es decir, operadores diferenciales de orden cero), porque de lo contrario podríamos usar trucos a la integración por partes para redistribuir lo que pertenece al bulto y lo que pertenece al límite. Resulta que para la acción EH en una variedad con un límite, esto no es posible sin el término límite GHY (debido a las mayores derivadas del espacio-tiempo en la acción EH).

No estoy completamente de acuerdo con ninguna de las respuestas, así que aquí hay otra. Parece que las preguntas de OP se reducen esencialmente a dos preguntas razonablemente independientes:

Pregunta 1: ¿Cuál es la definición de la derivada funcional de una acción y los términos y condiciones de contorno afectan esta definición?

Pregunta 2: ¿Qué hace que un principio variacional esté bien planteado o mal definido y cómo lo afectan los términos de frontera?


I. Sobre la derivada funcional: no me gusta la noción de "derivada funcional" porque tal como aparece en la mayoría de los textos y publicaciones de física, no es un objeto u operador matemático rigurosamente definido. Diferenciemos entonces entre la derivada funcional y el operador de Euler-Lagrange (operador EL).

Suponer que X es un suave norte -colector, π : Y X es una variedad de fibras lisas sobre X cuyas secciones (posiblemente locales) son los campos que aparecen en el problema variacional, y sea L : j ( π ) Λ norte X ser un lagrangiano norte -forma. En esta respuesta quiero evitar el uso de espacios jet tanto como sea posible, por lo que la definición de un Lagrangiano norte -la forma será la de cada tramo local ϕ Γ π ( tu ) de π encima tu X asocia un suave norte -forma L [ ϕ ] Ω norte ( tu ) encima tu y tiene la propiedad de que existe un entero no negativo r norte (llamado el orden de L ) tal que si dos secciones ϕ , ψ ambos definidos cerca X tiene las mismas derivadas hasta e incluyendo el orden r en X (se toman derivados con respecto a cualquier tabla fibrada de la fibración π ), entonces L [ ϕ ] X = L [ ψ ] X . Trabajando en un gráfico de fibra esto nos permite escribir un familiar

L [ ϕ ] X = L ( X , ϕ ( X ) , ϕ ( 1 ) ( X ) , , ϕ ( r ) ( X ) ) d X 1 d X norte
forma para el lagrangiano norte -forma. Las derivadas exteriores son entonces derivadas exteriores totales , es decir, se diferencian a través de las dependencias funcionales del campo. ϕ y sus derivados.

La primera fórmula de variación para el Lagrangiano es entonces

d L [ ϕ , d ϕ ] = mi ( L ) [ ϕ ] d ϕ + d Θ [ ϕ , d ϕ ] ,
donde en general mi ( L ) [ ϕ ] es orden 2 r en ϕ y algebraica en d ϕ (indicado por la "notación de puntos") mientras que Θ es orden 2 r 1 en ϕ y el orden r 1 y lineal en d ϕ .

Esta fórmula también es válida globalmente, pero si r > 2 y norte > 1 entonces lo existente globalmente Θ norte 1 -form no se construye únicamente a partir de los coeficientes del Lagrangiano, necesita algunos datos adicionales, como una partición de unidad o una conexión. No hace falta decir que no es único. El operador de orden cero d ϕ mi ( L ) d ϕ sin embargo, se define globalmente y es único. Llamamos L mi ( L ) el operador EL .

Tenga en cuenta que aquí no se necesitan condiciones de contorno en absoluto. Una forma diferente de ver las cosas es definir

mi ( L ) = [ d L ] = d L modificación términos exactos .
Resulta que cada clase [ d L ] tiene un representante único que es algebraico, en lugar de diferencial, en la variación del campo d ϕ . Este representante canónico de esta clase es precisamente
mi ( L ) d ϕ = k = 0 r ( 1 ) k d m 1 d m k L ϕ , m 1 . . . m k i d ϕ i d norte X .

Entonces, esto es esencialmente consistente con lo que OP escribió y también ha sido aludido por la respuesta de J.Murray. No hay nada de malo en definir el operador EL de esta manera y, de hecho, así es como se hace (al menos en espíritu), por ejemplo. la teoría del bicomplejo variacional .

Por el contrario, para una noción adecuada de derivada funcional d querríamos lo siguiente:

  1. El espacio F := Γ π ( X ) de secciones lisas puede equiparse con alguna estructura diferenciable generalizada.
  2. Funcionales (es decir, básicamente funciones en F ) de la forma
    S [ ϕ ] = X L [ ϕ ]
    dónde L es un orden suave r Lagrangiana, son suaves.
  3. La derivada funcional d es una especie de operador diferencial bien definido en funciones suaves en F que en cierto sentido reproduce el operador EL, p. d S = 0 mi ( L ) = 0 , cuando sea S es un funcional de "tipo acción".
  4. En principio, la derivada funcional puede aplicarse a funcionales más generales que los funcionales de acción, es decir, aquellos que son "menos locales".

Esto se puede hacer y lo haré en el Apéndice al final de esta respuesta. Sin embargo, es algo sutil. Para ilustrar algunas de las sutilezas, el espacio Γ π ( X ) podría estar vacío, es decir, la fibración π podría no tener secciones globales. El enfoque "formal" anterior que nos dio la definición del operador EL es una formulación local que esencialmente opera con poleas (bueno, en realidad, chorros) de secciones, por lo que si el conjunto de secciones globales está vacío, siempre podemos restringir más. Es menos evidente cómo tener en cuenta esta localidad en una formulación puramente funcional, ya que el espacio funcional debe fijarse de una vez por todas. Además, aunque existan secciones globales, la integral S [ ϕ ] = X L [ ϕ ] podría fallar en converger, aunque como una "integral formal" (cf. serie de potencias formales) aún contiene información válida.

Dado que el enfoque formal opera sin integrales, esto no es un problema.

El punto es que OP es esencialmente correcto con

No veo cómo la presencia de Θ nos impide definir mi i como los derivados funcionales.

aunque según mis gustos, aquí reemplazaría el término "derivado funcional" por "operador EL".

No obstante, al final de esta respuesta se dará una definición rigurosa de la derivada funcional que, con suerte, ilustra cómo las condiciones de contorno se relacionan con la definición.

II. Sobre el buen planteamiento de los principios variacionales: En esta sección me ocuparé únicamente de la formulación variacional de las ecuaciones diferenciales ordinarias (EDO). La razón de esto es que, a diferencia de las EDO, donde el teorema de existencia y unicidad de Picard-Lindelöf proporciona un conjunto muy general de criterios para la buena formulación de las ecuaciones diferenciales, los sistemas de EDO no tienen teoremas análogos, al menos ninguno cuya generalidad sea comparable.

Así que consideremos los siguientes datos:

  1. Un intervalo cerrado y compacto I = [ t 0 , t 1 ] .
  2. Un suave norte -colector q (espacio de configuración). Quiero trabajar con coordenadas, así que supongamos que q R norte es un conjunto abierto. La generalización al caso cuando q es una variedad más general es inmediata.
  3. Una función lagrangiana suave
    L [ q ] ( t ) = L ( t , q ( t ) , q ( 1 ) ( t ) , , q ( r ) ( t ) )
    de orden r .
  4. El espacio funcional F = C ( I , q ) de funciones suaves de I a q .

Necesitamos una fórmula general de primera variación para el Lagrangiano. Es

d L = mi i d q i + d d t ( k = 0 r 1 PAG i ( k + 1 ) d q ( k ) i ) ,
donde por supuesto F ( k ) = d k F / d t k , y los momentos canónicos son
PAG i ( k ) = yo = 0 r k ( 1 ) yo d yo d t yo L q ( k + yo ) i , 1 k r .
Tenga en cuenta que continuar formalmente con k = 0 tenemos PAG i ( 0 ) = mi i .

II. A. Condiciones de contorno:

Asociados con un problema variacional hay dos tipos de condiciones de contorno, condiciones de contorno impuestas y condiciones de contorno naturales . Estos son solo los dos extremos, en la práctica, uno puede usar una mezcla de los dos.

Dejar

B = { a 0 i , a 1 i , , a r 1 i , b 0 i , b 1 i , , b r 1 i }
ser un conjunto de 2 norte r números, que llamamos condiciones de contorno . Tener condiciones de contorno impuestas significa que consideramos solo aquellas trayectorias (suaves) q : I q que satisfacen
q ( k ) i ( t 0 ) = a k i , q ( k ) i = b k i , 0 k r 1.
Dejar
F B = { q F :   q  satisface los BC  B } .

Por lo tanto, si las condiciones de contorno B se imponen, consideramos el principio variacional en el espacio funcional reducido F B . Como variamos en esta clase, las variaciones de las trayectorias son suaves y satisfacen

d q ( k ) i ( t 0 ) = d q ( k ) i ( t 1 ) = 0 , 0 k r 1.

Entonces se sigue que la primera variación de la acción es

d S = t 0 t 1 mi i d q i d t ,
ya que los términos de contorno desaparecen debido a las condiciones de contorno. Por lo tanto, la condición de estacionariedad d S = 0 conduce a la ecuación diferencial mi i [ q ] = 0 .

Para obtener condiciones de frontera naturales, consideramos el espacio completo F como escenario del problema variacional. La primera variación de la acción se convierte en

d S = t 0 t 1 mi i d q i d t + k = 0 r 1 PAG i ( k + 1 ) d q ( k ) i | t 0 t 1 ,
con términos de contorno distintos de cero. Si d S = 0 es ser válido en alguna trayectoria q para cualquier variación d q , también debe ser cierto para aquellas variaciones que, por ejemplo. satisfacer la condición de contorno B o tener apoyo estrictamente dentro I , por lo tanto, la ecuación EL mi i [ q ] = 0 todavía debe aplicar. Sin embargo, al volver a colocar esto en la primera fórmula de variación para la acción, se obtiene un término límite puro:
d S [ q ] = k = 0 r 1 PAG i ( k + 1 ) [ q ] ( t 1 ) d q ( k ) i ( t 1 ) k = 0 r 1 PAG i ( k + 1 ) [ q ] ( t 0 ) d q ( k ) i ( t 0 ) .

Como las variaciones y sus derivadas pueden, en principio, tomar cualquier valor posible en los extremos, obtenemos que todos los coeficientes deben anularse por separado, por lo tanto

PAG i ( k ) ( t 1 ) = PAG i ( k ) ( t 0 ) = q , 1 k r .
En otras palabras, los momentos canónicos tienen que desaparecer en los puntos finales. Esto es entonces de nuevo un conjunto de 2 norte r condiciones de contorno en las funciones q i ( t ) , y dado que aparecieron dinámicamente, los llamamos "naturales".

II. B. Principios variacionales bien planteados:

La definición común de un problema variacional bien planteado es la siguiente: El principio variacional d S [ q ] = 0 está bien planteada si, dadas las condiciones de contorno pertinentes (impuestas o naturales), hay un único extremo de la acción.

Si el lagrangiano L es orden r , hay aproximadamente tres condiciones suficientes para que el principio variacional esté bien planteado. No me atrevo a afirmar que también son necesarias, ya que supongo que incluso si se violan algunas, pueden ocurrir algunos accidentes extraños, pero para la mayoría de los propósitos, estas condiciones también son necesarias:

  1. el lagrangiano L debe ser regular, es decir
    det ( 2 L q ( r ) i q ( r ) j ) 0
    .
  2. Las ecuaciones EL mi i [ q ] = 0 son orden 2 r (en realidad, 1. implica esto, pero no viceversa).
  3. No se realizan "elecciones desafortunadas de datos de punto final".

El punto 3 es el más misterioso aquí, pero se elaborará más adelante. Las ecuaciones EL tienen la forma

mi i [ q ] = ( 1 ) r 2 L q ( r ) i q ( r ) j q ( 2 r ) j + Términos de orden inferior ,
por lo tanto, si se cumple la condición 1. y la matriz W i j = 2 L q ( r ) i q ( r ) j es invertible, al multiplicar por la inversa obtenemos
q ( 2 r ) i = F i ( t , q , q ( 1 ) , , q ( 2 r 1 ) )
para la ecuación EL, que está en forma estándar, y se aplica el teorema de Picard-Lindelöf (PL). Sabemos que - una vez que el tiempo inicial t 0 es fijo, esta ecuación tiene solución única dadas las posiciones iniciales, velocidades, aceleraciones, ..., 2 r 1 -derivados q i ( t 0 ) , q ( 1 ) i ( t 0 ) , , q ( 2 r 1 ) i ( t 0 ) se especifican. Esto es 2 norte r datos iniciales.

Pero hemos visto que el número de condiciones de contorno (impuestas o naturales) también es 2 norte r , por lo que desde una perspectiva puramente "numerológica", las condiciones de contorno solo contienen suficientes datos para especificar de forma única una solución de la ecuación EL.

Sin embargo, el principio variacional quiere condiciones de contorno y el teorema PL quiere datos iniciales. "La mayoría de las veces", hay un mapa biyectivo entre los dos, pero para las elecciones "malas" de los puntos finales, esta correspondencia podría romperse. Un ejemplo típico es el oscilador armónico.

q ¨ + k 2 q = 0 ,
cuya solución general es
q ( t ) = C 1 porque ( k t ) + C 2 pecado ( k t ) ,
dónde C 1 y C 2 se puede relacionar directamente con las condiciones iniciales en, por ejemplo. t = 0 . Sin embargo, considere el problema del valor en la frontera q ( 0 ) = a ,   q ( T ) = b por un tiempo final T . la relacion es
a = C 1 , b = C 1 porque ( k T ) + C 2 pecado ( k T ) ,
que es irresoluble para C 2 en términos de a y b cuando T = norte π / k para norte Z . Entonces, por ejemplo, si elegimos el intervalo I = [ 0 , π / k ] para el dominio de la dinámica, entonces el principio variacional para el oscilador armónico se vuelve mal definido aunque se cumplan las condiciones 1. (y por lo tanto 2.).

Por otro lado, si se satisfacen las condiciones 1, 2 y 3, entonces 1) la ecuación EL está en forma estándar y, por lo tanto, se aplica el teorema PL, 2) las condiciones de contorno (impuestas o naturales) producen exactamente 2 norte r piezas de datos para la ecuación diferencial, 3) estos datos se pueden mapear biyectivamente a los datos iniciales, por lo tanto, hay un extremo único para el problema variacional y, por lo tanto, el principio variacional está bien planteado.

II. C. Bien, pero ¿qué tiene esto que ver con los términos de frontera?

Comience con un ejemplo: El Lagrangiano

L = 1 2 q q ¨ 1 2 k 2 q 2 .
Este es un Lagrangiano de segundo orden para el oscilador armónico. Se puede obtener a partir de la habitual sumando una derivada temporal total. la variacion es
d L = ( q ¨ + k 2 q ) d q + d d t ( 1 2 q ˙ d q 1 2 q d q ˙ ) .
Suponiendo un intervalo I = [ 0 , T ] y por sencillez T norte π / k , las condiciones de contorno impuestas son
q ( 0 ) = a , q ( T ) = b q ˙ ( 0 ) = a , q ˙ ( T ) = b ,
dónde a , a , b , b son datos independientes. Estos son cuatro datos para una ecuación de segundo orden, por lo que al especificarlos adecuadamente, se puede crear un sistema irresoluble. Dado que ahora hay condiciones de contorno para las que no hay extremos, este principio variacional ya no está bien planteado.

Cabe señalar, sin embargo, que el lagrangiano "habitual" L = 1 2 q ˙ 2 1 2 k 2 q 2 da un problema variacional bien planteado si T norte π / k . Además, el problema del valor en la frontera dado por las condiciones de frontera naturales en L es en realidad solucionable, aunque da la solución cero trivial. Sin embargo, uno podría preparar fácilmente un Lagrangiano para el oscilador armónico donde incluso las condiciones de contorno naturales son malas.

Más generalmente, si L es una orden r Lagrangiano con momentos canónicos PAG i ( k ) ( 1 k r ), y el lagrangiano se cambia como

L = L + d F d t ,
dónde F es una orden r 1 función (por lo tanto L y L tienen el mismo orden), entonces el número de condiciones de contorno no cambia, pero los momentos canónicos cambian como
PAG i ( k ) = PAG i ( k ) + F q ( k 1 ) i .
Se podría haber notado que las condiciones de contorno impuestas son flexibles (pueden establecerse arbitrariamente), pero las condiciones de contorno naturales no lo son , es decir, siempre son que los momentos canónicos deben desaparecer en los puntos finales. La capacidad de ajustar las condiciones de contorno naturales aparece entonces en la transformación de equivalencia L = L + d F / d t , que luego permite establecer las condiciones de contorno naturales arbitrariamente.

Sin embargo la transformación L = L + d F / d t también conserva las ecuaciones EL si, por ejemplo, L es orden r pero F es orden s 1 con s > r . Entonces ahora L es un lagrangiano de orden s > r y viene con 2 norte s > 2 norte r condiciones de contorno, pero las ecuaciones EL siguen siendo de orden 2 r y por lo tanto requieren 2 norte r pedazos de datos Las condiciones de contorno adicionales obtenidas de esta manera son en esencia arbitrarias y sobredeterminan el problema del valor de contorno. Por lo tanto, si la orden s del lagrangiano del que se deriva un orden 2 r se obtiene la ecuación es tal que 2 s > 2 r , entonces este principio variacional está necesariamente mal definido ya que existen condiciones de contorno (incluidas las naturales) a las que no corresponde ningún extremo.

Finalmente la pregunta de OP

Entonces, ¿por qué los términos de frontera hacen que el principio variacional esté mal definido? En otras palabras, ¿por qué un principio variacional bien definido exige d I [ ϕ ] ser de la forma d I [ ϕ ] = ( algo ) d ϕ como parecen afirmar los autores del artículo?

se puede responder: estrictamente hablando, no es necesario que la variación sea de la forma d S [ ϕ ] = ( ) d ϕ para que el principio variacional esté bien definido, ya que los términos de contorno que quedan simplemente se convierten en condiciones de contorno naturales. Sin embargo, si las condiciones de contorno naturales son en sí mismas inapropiadas (por ejemplo, hay demasiadas), esto puede resultar en un principio de variación mal definido.

II. D. Simetrías de calibre, sistemas PDE y todo ese jazz:

No quiero entrar en esto de manera muy detallada, pero para los sistemas que no satisfacen det ( W i j ) 0 o sistemas PDE, el análisis anterior es mucho más complicado.

La condición de singularidad det ( W i j ) = 0 señala la presencia de simetrías de calibre, es decir, la solución general del sistema contiene funciones de tiempo arbitrarias, por lo que el principio variacional y cualquier posible problema de valor inicial o límite está mal definido, ya que cualquier solución dada siempre puede transformarse de calibre en una nueva solución que conserva el problema de valor inicial o límite. Para manejar estos casos, es necesario utilizar algún tipo de esquema de reducción (fijación de calibre, el proceso de Dirac-Bergman, reducción simpléctica, BV/BRST, etc.) para reformular esencialmente el problema sin simetrías de calibre.

Para los sistemas PDE, el análogo más cercano al teorema PL es el teorema de Cauchy-Kovalevskaya, pero eso solo funciona para sistemas evolutivos con coeficientes analíticos. Por lo tanto, el análisis anterior a menudo también se aplica a las teorías de campo por analogía, pero para obtener resultados rigurosos, es necesario un análisis caso por caso.

Apéndice. Un modelo riguroso para derivadas funcionales:

Usamos la formulación de espacios difeológicos (una buena fuente para eso es el libro de Patrick Iglesias-Zemmour ). Indico aquí sólo lo básico. Para pag norte a pag -dominio es un subconjunto abierto tu de R pag . Un dominio es entonces un pag -dominio para algunos pag . dado un conjunto Z a pag -parametrización de Z es un mapa fijo φ : tu Z , dónde tu es un pag -dominio, y una parametrización de Z es un pag -parametrización para algunos pag .

Una difeología sobre Z es una colección D de parametrizaciones, llamados gráficos que satisfacen los siguientes axiomas:

  1. Cobertura : Cada parametrización constante es un gráfico.
  2. localidad : si φ : tu Z es una parametrización tal que en alguna vecindad de cada r tu la restricción a ese barrio es un complot, entonces φ es una trama
  3. Compatibilidad suave : Si φ : tu Z es una trama y F : V tu es un mapa suave ( V es también un dominio) entonces φ F también es una trama.

Entonces la pareja ( Z , D ) es un espacio difeológico pero lo acortaremos a Z si la difeología es clara por el contexto. Espacios difeológicos dados Z , W un mapa ϕ : Z W es suave si para cualquier parcela φ : tu Z , el mapa ϕ φ : V W también es una trama. Los espacios difeológicos molan porque la categoría D i F F cuyos objetos son el espacio difeológico y cuyos morfismos son mapas suaves está básicamente cerrado bajo cada conjunto u operación categórica bajo el sol (sumas, productos, cocientes, mapeo de espacios/exponenciales, límites, colímites, etc.).

Un diferencial k -formulario en Z es una regla que para cada trama φ : tu Z asocia un liso ordinario k -forma ω [ φ ] Ω k ( tu ) en el dominio de la trama tal que para cualquier mapa suave F : V tu ( V también es un dominio)

ω [ φ F ] = F ω [ φ ] .
Luego, el producto exterior, el derivado exterior y el retroceso de las formas diferenciales se definen de forma natural, todos con las propiedades habituales (haciéndolos conmutar con evaluaciones en parcelas).

Necesitamos un par de cosas más sobre los espacios difeológicos:

  • La topología D en Z es la mejor topología que hace que todas las parcelas sean continuas.

  • Un espacio difeológico está conectado (escribiendo la topología D) si y sólo si está conectado por caminos suavemente, es decir, dos puntos cualesquiera pueden estar conectados por una curva suave.

  • Si ω Ω k ( Z ) es un diferencial k -forma, entonces ω = 0 si y solo si ω [ φ ] = 0 para cualquier k -trama φ (en otras palabras, las formas diferenciales están determinadas únicamente por la k -parcelas).


En lugar de trabajar con colectores de fibra generales, consideremos un modelo simplificado que hace que algunas cosas sean más transparentes. Dejar X R norte frijol norte subvariedad compacta dimensional con límite de R norte y deja Y R metro sea ​​un subconjunto abierto convexo.

Considere el espacio funcional

F = C ( X , Y )
de mapas suaves de X a Y . Nos difeologizamos F en una multitud de maneras.

  • La difeología funcional estándar se define de la siguiente manera. Dado tu R pag a pag -dominar un mapa φ : tu F es un diagrama si y solo si el mapa conjunto φ : tu × X Y ,   ( s , X ) φ ( s ) ( X ) es suave.
  • arreglar un número r norte { , ω } . Una parametrización φ : tu F es un gráfico de la difeología variacional de orden r si 1) φ es un gráfico de la difeología funcional estándar, 2) la función conjunta φ ( s ) ( X ) es tal que (por 0 r < ) para cada 0 k r los derivados
    k φ i X m 1 . . . X m k ( s ) ( X )
    son funciones constantes de s tu cuando X X es un punto límite. Esta definición también sirve para r = en el sentido de que todas las derivadas parciales deben satisfacerla.
  • Para r = ω en cambio, la definición es que el límite X tiene algo de barrio norte X tal que φ ( s ) ( X ) es una función constante de s cuando X norte .

En norte { , ω } configurar el pedido norte < < ω para cualquier norte norte .

Como antes, una función S : F R es de tipo acción si hay un lagrangiano de orden finito L [ ϕ ] en X asociado con F tal que

S [ ϕ ] = X L [ ϕ ] = X d X L ( X , ϕ ( X ) , , ϕ ( r ) ( X ) ) ,
donde aqui d X = d norte X . Esta integral converge porque X es compacto Si L es orden r , entonces la función de tipo acción S también se dice que es orden r . Entonces:

  1. una función de tipo acción S especificado por un lagrangiano suave es suave con respecto a la difeología funcional estándar y todas las difeologías variacionales en F ;
  2. si S es una orden r funcional de tipo acción, y F está equipado con la difeología variacional de orden k r 1 , entonces su derivada exterior puede identificarse con la derivada funcional habitual .

Verificamos específicamente este último punto en un pedido r función de tipo acción. Para distinguir la derivada exterior en F y en cualquier dominio tu de diferenciales en X , usamos d para el primero. La derivada exterior d S es un bien definido 1 -formulario en F por lo que es suficiente para evaluarlo en un 1 -trama. en cualquier 1 -trama s φ ( s ) = ϕ s tenemos

d S [ ϕ s ] = S [ ϕ s ] s d s = [ X d X k = 0 r L ϕ , m 1 . . . m k i [ ϕ s ] m 1 m k ϕ s i s ] d s = [ X d X k = 0 r ( 1 ) k d m 1 . . . d m k L ϕ , m 1 . . . m k i [ ϕ s ] ϕ s i s + X ( d X ) m k = 0 r 1 PAG i m m 1 . . . m k [ ϕ s ] m 1 m k ϕ s i s ] d s .
Podemos escribir
m 1 m k ϕ s i s = s ( m 1 m k ϕ s i )
y por la definición de la difeología variacional (asumiendo que el orden de la difeología es al menos r 1 ), estas funciones desaparecen en X , por lo tanto, los términos de frontera son cero y obtenemos
d S [ ϕ s ] = [ X d X mi i [ ϕ s ] ϕ s i s ] d s ,
que de hecho contiene la misma información que la derivada funcional/EL en el sentido habitual.

Así que si equipamos F con la difeología variacional de orden o ω , entonces todos los funcionales de tipo acción son diferenciables y la derivada exterior es básicamente la derivada funcional. El espacio F todavía contiene todas las funciones suaves de X a Y , por lo que no hubo que imponer condiciones de contorno y, no obstante, la derivada funcional está bien definida y tiene la forma clásica.

Sin embargo, las restricciones de límites todavía están codificadas en el espacio a través de su difeología. Bajo los supuestos hechos en Y p.ej. que es convexo (lo cual no es estrictamente necesario, pero simplifica la demostración), encontramos los siguientes hechos sobre la conectividad del espacio F .

Primero, supongamos que F está equipado con el variador r -difeología ( r norte { , ω } ). dos campos ϕ , ψ F son b -equivalente si para cada X X es cierto que

m 1 m k ϕ i ( X ) = m 1 m k ψ i ( X ) , 0 k r ,
y para el ω -diffeología en cambio la condición de b -equivalencia es que hay una vecindad de la frontera X en lo que están de acuerdo. Dejar b ϕ denota la clase de equivalencia a la que ϕ pertenece a bajo b -equivalencia.

Entonces:

  1. Si F está equipado con la difeología funcional estándar, el espacio F está conectado.
  2. Si F está equipado con el variador r -difeología ( r norte { , ω } ) entonces F está desconectado y los componentes conectados de F están en biyección con el conjunto de todos b -clases de equivalencia b ϕ .

[Podría dar una prueba de esto más tarde, pero es sencillo y estoy cansado]

El efecto neto de esto es que esencialmente

F = b ϕ F b ϕ
es una unión de componentes conectados tal que cada miembro F b ϕ es un conjunto de campos que satisfacen las condiciones de contorno prescritas apropiadas (que pueden ser diferentes en comparación con las BC habituales impuestas/naturales, en particular la condición de contorno correspondiente a la ω -la difeología es bastante diferente).

También tiene algún efecto sobre las propiedades de exactitud del diferencial. d . Por ejemplo, también es cierto para los espacios difeológicos que si una función suave es cerrada (es decir, d F = 0 ) entonces es localmente constante, a saber. constante en cada componente conectado por separado.

Se sabe por el cálculo de variaciones que en una función de tipo acción S , d S = 0 no significa eso S es constante, en lugar de (asumiendo que X y Y son contráctiles) que su integrando (Lagrangiano) es una divergencia total, de ahí los valores de S están determinados por los valores que el campo y un número de sus derivados toman en el límite. El mismo resultado se obtiene del análisis anterior cualitativamente, ya que si d S = 0 entonces S debe ser constante en cada componente conectado F b ϕ por separado y (asumir el o ω difeologías) como los espacios F b ϕ están especificados por los valores límite de los campos en este componente, esto muestra que S [ ϕ ] (para d S = 0 ) factores a través de la clase b ϕ como se esperaba.


Quitar una cosa de este apéndice es que las derivadas funcionales en el cálculo de variaciones se pueden definir bien independientemente de cualquier conjunto de condiciones de contorno impuestas a los campos o cualquier término de superficie que aparezca en la acción, sin embargo, bajo un marco riguroso, Las condiciones de contorno aparecen de manera esencial en la definición de la propia suavidad y afectan a las propiedades topológicas del espacio de funciones.