Definición rigurosa de la variación.

Es común en Física hablar de la variación en el contexto del cálculo de variaciones. En particular, dada una acción S que es un funcional hablamos de la variacion d S .

En el contexto de la Mecánica Clásica se puede dar sentido al principio variacional de la siguiente manera: consideramos la variedad de configuración METRO del sistema de partículas y consideramos el Lagrangiano como L : T METRO R definido en el haz tangente.

En ese caso, definimos la acción S como el funcional definido en caminos γ : [ a , b ] R METRO por

S [ γ ] = a b L ( γ ( t ) , γ ( t ) ) d t .

Entonces consideramos una variación en el camino como una familia de caminos parametrizada ϕ : [ a , b ] × ( ϵ , ϵ ) METRO de modo que ϕ ( t , s ) = γ s ( t ) .

En ese caso obtenemos una función

S [ γ s ] = a b L ( ϕ ( t , s ) , t ϕ ( t , s ) ) d t

Para que podamos estudiar el extremo de este R R función por diferenciación

d S [ γ s ] d s = d d s a b L ( ϕ ( t , s ) , t ϕ ( t , s ) ) d t

y esto se puede resolver usando un gráfico ( tu , q ) en METRO que se eleva a un gráfico ( T tu , ( q , q ˙ ) ) en T METRO .

Aunque riguroso esto no define la operación de variación. Actualmente estoy estudiando Relatividad General, y en el contexto de la Teoría Clásica de Campos apareció mucho este concepto de variación.

De hecho, cuando se derivan las ecuaciones de Einstein a partir de la acción de Einstein-Hilbert, se calcula la variación d S y lo pone a cero. Esto incluye computación d R a b Por ejemplo.

En otras palabras, esta operación de variación actúa sobre el funcional de acción, de modo que el principio de variación se convierte en d S = 0 , sin embargo también actúa sobre C funcionan en la variedad como d R a b .

Mi pregunta aquí es: en este contexto de la Relatividad General y la Teoría Clásica de Campos, ¿cómo se define rigurosamente la operación de variación? d ? ¿Cómo puede actuar tanto sobre funcionales como sobre funciones? ¿Cómo se relaciona con el enfoque tradicional de la mecánica clásica que describí anteriormente?

Siento que tu pregunta es similar a para una función F ( X ) , por qué puedes escribir d F y d X para algún operador diferencial d . No puedo imaginar el operador variacional d ser diferente del normal d , a excepción del espacio en el que vive.
Pero una función como la de la que hablas se define en una variedad suave METRO y tiene una definición precisa de d F . Definimos d F ser el campo covector tal que d F ( X ) = X F para todos los campos vectoriales X . No podemos hacer lo mismo por S , desde S no se define en una variedad uniforme, sino en un conjunto de funciones. En principio este conjunto de funciones podría estar dotado de tal estructura, pero creo que sería muy poco natural y engorroso. Así que creo que la forma precisa de dar sentido a d es un poco diferente Ese es mi punto aquí.
No creo que el espacio funcional S es sin estructura. Tenemos adición de funciones al menos, así que S es un espacio vectorial. En física, asumimos que las funciones pueden converger entre sí. Esto requiere alguna noción de norma. Típicamente también asumimos S está completo bajo esta norma. Por eso S es un espacio vectorial completo normado (de Banach), que admite una derivada de Frechet (funcional). Es cierto que no estoy familiarizado con las matemáticas formales, por lo que esto no es una respuesta completa.
Ese no es el punto en mi humilde opinión. La acción S es un funcional. Se define en el espacio de caminos. C ( I , METRO ) dónde I = [ a , b ] R . Ahora, el espacio C ( I , METRO ) no lleva la estructura de un espacio vectorial. METRO no necesariamente tiene operaciones sobre puntos. Ya que para cada t [ a , b ] , γ ( t ) METRO no está claro cómo podemos formar λ γ + α , ya que las operaciones puntuales no están disponibles. La acción es un mapa. S : C ( I , METRO ) R y desde C ( I , METRO ) no es un espacio vectorial del que no podemos hablar derivado de Frechet S .

Respuestas (2)

Se puede dar una definición por generalización directa de la de la pregunta. Toma el espacio de los campos para que sea el espacio C ( X , METRO ) de funciones suaves entre dos variedades. Para cualquier suave funcional S : C ( X , METRO ) R y cualquier familia de campos de un parámetro h : R × X METRO podemos definir una función F S , h C ( R ) por F S , h ( t ) = S ( h t ) . La variación d S es el diferencial d F S , h de este mapa.

En el caso de la mecánica, solo estamos especializando esta definición para X = [ a , b ] . En la relatividad general, X es el espaciotiempo. R m v debe verse en este contexto como una función sobre la variedad que asigna a cualquier punto X X un funcional R m v ( X ) de la métrica.

El usuario coco fue más rápido (y más corto), por lo que la respuesta puede tener como objetivo ampliar un poco los aspectos técnicos del cálculo de variaciones para la teoría de campos clásica (local).

Un libro de física que hace un trabajo bastante bueno al definir la variación de un funcional de acción para la teoría de campos es General Relativity de Robert M. Wald (University of Chicago Press, 1984) - ver Apéndice E, pp. 450ff. Sin embargo, dado que todavía deja de lado algunos detalles técnicos, describiré el procedimiento a continuación.

La idea es esencialmente la misma que escribiste para la mecánica clásica. Uno entiende las configuraciones de campo (entre estas, la métrica de espacio-tiempo gramo ) como secciones suaves

ϕ Γ ( π ) := { ϕ C ( METRO , mi )   |   π ϕ = i d METRO }
de algún haz de fibras π : mi METRO sobre la variedad espacio-tiempo METRO . Las variaciones de campo (finitas) son solo mapas suaves Φ : METRO × I mi , dónde I R es un intervalo abierto tal que
ϕ s := Φ ( , s ) Γ ( π )
para todos s I . Esto último significa que ϕ s ( pag ) = Φ ( pag , s ) π 1 ( pag ) para todos pag METRO , s I - particularmente, si (digamos) 0 I y ϕ 0 = ϕ , entonces una variación de campo infinitesimal alrededor ϕ se daría en cada pag METRO por d ϕ ( pag ) = Φ ( pag , s ) s | s = 0 . Resulta que d ϕ puede verse como una sección suave del retroceso
ϕ V mi := { ( pag , X ) METRO × V mi   |   ϕ ( pag ) = π T mi ( X ) }
del haz vertical
π T mi : V mi := { X T mi   |   T π ( X ) = 0 T METRO } mi
bajo ϕ , que puede verse como un "vector tangente" a Γ ( π ) en ϕ . Por el contrario, si pones una métrica riemanniana (completa) en las fibras de mi , puede usar el mapa exponencial asociado a ellos para construir una variación de campo a partir de una infinitesimal.

Esta es mas o menos la imagen de Γ ( π ) como una variedad de dimensión infinita (hay algunas advertencias que se analizan brevemente en el apéndice técnico al final de esta respuesta, pero no tienen ninguna consecuencia en lo que sigue).

Para pasar de ahí a las variaciones de acción, primero es necesario delinear qué es una función de acción. Recuerde que un funcional en Γ ( π ) es solo un mapa F : Γ ( π ) C . Resulta que una acción no es un solo funcional, sino una familia de funcionales { S k   | k METRO  compacto } tal que S k ( ϕ 1 ) = S k ( ϕ 2 ) para todos ϕ 1 , ϕ 2 Γ ( π ) tal que ϕ 1 = ϕ 2 en k . El punto aquí es dar cuenta de la posibilidad (más frecuente) de que la densidad lagrangiana evaluada en ϕ no es integrable en su totalidad METRO . Si se requiere además que cada S k es local y depende de las derivadas de ϕ a la orden (decir) r (en un sentido preciso que no definiré aquí), se sigue que

S k ( ϕ ) = k L ( pag , ϕ ( pag ) , ϕ ( pag ) , , r ϕ ( pag ) ) d norte X   ,
donde la densidad lagrangiana L es suave en sus argumentos (también requerimos que L no depende de k , por supuesto, esto se puede codificar en condiciones de compatibilidad entre los S k 's, cuyos detalles son irrelevantes para nosotros aquí).

Estoy siendo deliberadamente suelto en la definición de derivados (de primer orden y de orden superior) k ϕ de tramos lisos ϕ de π (que codifican, en el caso de ϕ = gramo , la curvatura de gramo y así sucesivamente) ya que esto requiere la noción de haces de chorro de π , que es un poco largo y nos desviará de nuestro objetivo principal aquí (puedo agregar algunos detalles sobre esto más adelante si lo considera necesario). Una vez que todo esto ha sido establecido, la variación (finita) de S k correspondiente a Φ es solo S k ( ϕ s ) , y la variación infinitesimal correspondiente es simplemente

d S k ( ϕ ) = d d s | s = 0 S k ( ϕ s )   .
En este punto, esto se convierte en una simple diferenciación estándar bajo el signo integral, lo cual está perfectamente permitido bajo los requisitos anteriores.

Un paso clave en la informática d S k ( ϕ ) es mostrar que los derivados de fibra y base conmutan , es decir

k Φ ( pag , s ) s = k Φ ( pag , s ) s   ,
de modo que k ( d ϕ ) = d ( k ϕ ) , para todos k r . De esta forma, se obtienen los términos de divergencia habituales que aparecen en los tratamientos estándar del cálculo de variaciones. Para deshacerse de ellos (al derivar las ecuaciones de Euler-Lagrange, por ejemplo), se puede suponer que las variaciones de campo infinitesimales se soportan en el interior de k (consulte el apéndice técnico a continuación para obtener más información al respecto) cuando sea necesario.

Es importante notar que el principio variacional expuesto anteriormente es inherentemente local , por lo que las consideraciones anteriores son en realidad independientes de k .

( Apéndice técnico: si desea tener algún tipo de estructura múltiple suave en Γ ( π ) , debe especificar qué espacio(s) vectorial(es) del modelo está empleando. Resulta que necesitas usar

Γ C ( ϕ V mi METRO ) := { X ϕ Γ ( ϕ V mi METRO )   |   X ϕ  tiene soporte compacto }
como modelos, de lo contrario la topología resultante de Γ ( π ) (utilizando los mapas exponenciales mencionados en el segundo párrafo anterior para construir un atlas) no se garantiza que esté conectado localmente en la ruta (esto puede fallar si METRO no es compacto), por lo tanto, no es una topología múltiple. Esto implica que se deben restringir las variaciones de campo Φ ser tal que para cada subintervalo compacto (= cerrado y acotado) j I hay un subconjunto compacto k METRO tal que Φ ( pag , s ) es constante en ( METRO k ) × j . La razón es que con el atlas antes mencionado, estas variaciones de campo se convierten precisamente en las suaves curvas de Γ ( π ) , y por lo tanto Γ C ( ϕ V mi METRO ) = T ϕ Γ ( π ) se convierte en el espacio tangente (sin comillas) a Γ ( π ) en ϕ . Curiosamente, estas son precisamente el tipo de variaciones de campo necesarias para derivar las ecuaciones de Euler-Lagrange, lo que otorga un peso adicional a su importancia que va más allá del mero requisito estético de coherencia con una estructura múltiple en Γ ( π ) . Otro detalle técnico es que si utiliza la topología de espacio vectorial localmente convexa estándar (límite inductivo) de Γ C ( ϕ V mi METRO ) para inducir la topología de Γ ( π ) a través del atlas anterior, se obtiene una estructura múltiple topológica (que, por cierto, es la llamada topología de Whitney en Γ ( π ) ) pero no suave . Para este último, debe usar la topología final inducida por las curvas suaves
Ξ : R Γ C ( ϕ V mi METRO )
en Γ C ( ϕ V mi METRO ) , que es más fina que la estándar. Las suaves curvas Ξ en Γ C ( ϕ V mi METRO ) , a su vez, son mapas suaves Ξ : METRO × I mi , dónde I R es un intervalo abierto tal que
X s := Ξ ( , s ) Γ C ( ϕ V mi METRO )
para todos s I tal que para cada subintervalo compacto j I hay un subconjunto compacto k METRO tal que el apoyo de X s está contenido en k para todos s j . (recuérdese que el apoyo de una sección X de un paquete de vectores sobre METRO es el subconjunto cerrado más pequeño s tu pag pag X de METRO tal que X es igual a la sección cero exterior s tu pag pag X ) Para (muchos) más detalles sobre el procedimiento descrito aquí, consulte el libro de Andreas Kriegl y Peter W. Michor, The Convenient Setting of Global Analysis (AMS, 1997))

Gracias por la respuesta. ¿Es realmente necesario tratar el espacio de las secciones con una estructura múltiple suave? Usando el formalismo de haz de chorro, ¿no podemos evitar esto y hacer todo en una variedad de dimensión finita? Escuché sobre ellos al tratar de dar sentido al campo Lagrangiano en esta pregunta ( physics.stackexchange.com/questions/143543/… ), así que creo que está relacionado con esta nueva pregunta sobre la variación.
Si solo está interesado en la estructura cinemática de los modelos teóricos de campo desde el punto de vista de las configuraciones de campo y cómo derivar ecuaciones variacionales como las ecuaciones de Euler-Lagrange, de hecho, el formalismo de haz en chorro es suficiente. La razón es que la noción de variación de campo que hemos definido es en sí misma local . Esto ya no es suficiente si quieres estudiar los espacios de soluciones de ecuaciones variacionales. Las personas que trabajan en el formalismo de haces en chorro por lo general tratan los espacios de solución de campo formalmente, con poca consideración por la estructura específica de las ecuaciones de movimiento.
Además, si desea estudiar la teoría de campos desde el punto de vista de los observables (= funcionales), los funcionales locales, como el funcional de acción en alguna región compacta, no se cierran bajo productos. Si realmente quieres un álgebra de observables, estás obligado a lidiar con funcionales no locales. Esto empeora aún más si desea tener algún tipo de estructura de Poisson: puede intentar identificar soluciones con datos iniciales para obtener una fórmula local para el soporte de Poisson, pero esa misma identificación no es local y se arruina después de la cuantificación. , especialmente para modelos interactivos.