¿Por qué hay dos definiciones para la derivada funcional?

He visto dos definiciones para la derivada funcional. ¿Por qué hay dos definiciones?

  1. En la mecánica clásica de Goldstein, 3ª edición, página 574 eq. (13.63), y también en Student's Guide to Lagrangians and Hamiltonans de Patrick Hamill en la página 55 eq. (2.10), la derivada funcional de una función Φ ( y , y , X ) , dónde y = y ( X ) , es dado por
    d Φ d y = Φ y d d X Φ y .
  2. La segunda definición de derivada funcional viene dada por
    d F [ y ( X ) ] d y ( X ) = límite ε 0 1 ε ( F [ y ( X ) + ε d ( X X ) ] F [ y ( X ) ] ) .
    Esta definición se encuentra en wikipedia y se usa en QFT. Esta definición nos dice que para el funcional
    S [ y ( X ) ] = Φ ( y , y , X ) d X
    dónde y = y ( X ) , la derivada funcional viene dada por
    d S d y = Φ y d d X Φ y

Una definición es en términos de una función y la otra en términos de un funcional, pero ¿ambos dan el mismo resultado?

¿Qué páginas?
En la mecánica clásica de Goldstein, 3ª edición, página 574 eq. (13.63), y también en Student's Guide to Lagrangians and Hamiltonans de Patrick Hamill en la página 55 eq. (2.10)

Respuestas (3)

Para un funcional

(0) S   =   d norte X   L ( X ) , L ( X )     L ( ϕ ( X ) , ϕ ( X ) , , X ) ,
la segunda definición con notación
(2) d S d ϕ α ( X )
es la definición tradicional de derivada funcional/variacional (FD), mientras que la primera definición con notación
(1) d L ( X ) d ϕ α ( X )
es el llamado FD del 'mismo espacio-tiempo', que oscurece/traiciona su origen variacional, pero a menudo se usa por conveniencia de notación. Para obtener más detalles, consulte, por ejemplo, mis respuestas de Phys.SE aquí y aquí .

Entonces, la idea más general proviene del cálculo variacional; es que tenemos un Lagrangiano mapeando un espacio de configuración L ( C ) : C R y tenemos un camino a través del espacio de configuración PAG ( s ) : [ 0 , 1 ] C y la acción es la integral de su composición S = 0 1 d s   L ( PAG ( s ) ) . La idea es que introducimos una pequeña perturbación de camino que se desvanece en los puntos finales: ϵ   pag ( s ) tal que pag ( 0 ) = pag ( 1 ) = 0.

El cambio resultante en la acción es

d S = 0 1 d s   ( L ( PAG + ϵ pag ) L ( PAG ) ) ,
y el objetivo es buscar los caminos a través del espacio de configuración PAG tal que para el primer orden la acción es estacionaria frente a tales perturbaciones de trayectoria; es decir límite ϵ 0 d S / ϵ = 0. Los físicos estamos robando las matemáticas que se usan para resolver esta ecuación.

¿Cómo obtenemos las ecuaciones de Euler-Lagrange a partir de este

Usted puede ver, en nuestra física descuidada, que L se escribe algo asi

L = 1 2 metro d r d t d r d t tu ( r ) .
El formalismo anterior no tiene espacio para este descuido: L no tiene ninguna noción del camino; no puede tomar derivadas temporales. En su lugar, tenemos que hacer el espacio de configuración C hexadimensional, que tiene tres dimensiones independientes de velocidad, independientes de las tres dimensiones independientes de posición que ya tenemos. Es decir, la expresión adecuada es L = 1 2 metro v v tu ( r ) sin noción, en el nivel lagrangiano, de la conexión entre v y r . Luego insertamos esta dependencia explícitamente en la forma de PAG y pag que estamos considerando. Para esto es útil escribir ϵ   pag como d r por un momento para que podamos expandir esto a primer orden en ϵ como:
d S = t 0 t 1 d t   i ( L r i   d r i + L v i d d t d r i ) ,
y luego la condición de que d r ( t 1 ) = d r ( t 0 ) = 0 es crucial porque nos permite integrar este último término por partes, para encontrar
d S = t 0 t 1 d t   i d r i ( L r i d d t L v i ) .
Note el significado muy extraño de esta expresión, es completamente importante: L es solo una función simple, tomamos una derivada parcial con respecto a una de sus variables independientes v i : luego evaluamos esta función derivada parcial en los puntos del camino ( r ( t ) ,   d r / d t ) , luego tomamos la derivada temporal de ese lío. Pero desde d r i puede ser arbitraria cada una de estas ecuaciones debe desaparecer independientemente para d S y debemos tener las ecuaciones de Euler-Lagrange,
L r i d d t L v i = 0 ,
en los puntos aceptables del camino. De nuevo, es muy importante para interpretar esta expresión que la derivada parcial con respecto a v i se toma sin indicación de que la posición y la velocidad están relacionadas, entonces la velocidad real r ˙ i se sustituye por él, y finalmente la derivada temporal se aplica a ambos por igual. Por lo tanto con una expresión 1 2 metro v v uno suele conseguir metro r ¨ i de este término, sin aporte de tu ( r ) que desapareció cuando tomamos la derivada parcial.

Cómo es más complicado que eso

Así que hemos visto que manejar las primeras derivadas en el tiempo en nuestra expresión provoca una ampliación del espacio de configuración que se resuelve fuera del Lagrangiano. Pero las segundas derivadas también deben tener exactamente el mismo principio, ahora necesitamos hacer que nuestro Lagrangiano dependa de ( r 1 , r 2 , r norte ,   v 1 , v 2 , v norte , a 1 , a 2 , a norte ) . Cuando hagamos las ecuaciones de Euler-Lagrange encontraremos por tanto un nuevo término, resultante de la doble integración por partes,

L r i d d t L v i + d 2 d t 2 L a i = 0.
Esto no suele ocurrir con las derivadas del tiempo en física, pero aquí hay un ejemplo en el que se produce a partir de las derivadas del espacio: considere la deformación de una viga a lo largo de la X -eje en el y -dirección, formando alguna forma y ( X ) . Hay algo de masa por unidad de longitud λ ( X ) y por lo tanto esperamos que la acción sea una suma sobre cada pequeño elemento de masa. Pero, ¿cuál es nuestra energía potencial aquí? Nuestra energía potencial no debe depender de y ( X ) o incluso y ( X ) ya que está bien que el haz quede plano en ángulo: su energía interna debe ser como y ( X ) , pero esperamos que esto funcione como un resorte de energía y, por lo tanto, que se eleve al cuadrado. También esperamos algo de fuerza. F ( X ) para hacer un trabajo en la viga. Todo esto provoca
L = 0 d X   ( 1 2 λ ( X )   [ y ˙ ( X ) ] 2 1 2 α ( X ) [ y ( X ) ] 2 + F ( X )   y ( X ) ) .
Ejecutamos exactamente el mismo argumento excepto que en lugar de d s dónde s [ 0 , 1 ] ahora estamos considerando un d s 2 = d s 1   d s 2 dónde ( s 1 , s 2 ) [ 0 , 1 ] × [ 0 , 1 ] , el "lagrangiano" resultante generalmente se denomina "densidad lagrangiana". Pero el mismo método de argumentación se mantiene en todo momento: y y y se consideran, para la densidad langrangiana L por el bien de ser totalmente independientes unos de otros y y y y ˙ , que también se consideran independientes entre sí. Las ecuaciones de Euler-Lagrange ahora se convierten en:
L y t L y ˙ X L y + 2 X 2 L y = 0.
Por lo tanto, derivamos la ecuación de la viga como,
F ( X ) λ ( X )   y ¨ 2 X 2 ( α ( X )   y ( X , t ) ) = 0.
En el caso de que α es constante y logramos un estado estacionario, vemos que lo que hay aquí es una expresión y ( 4 ) ( X ) = F ( X ) / α : es la cuarta derivada la que es importante cuando estamos considerando la carga de la viga. Esta es la teoría del haz de Euler-Bernoulli en pocas palabras y es algo muy complicado de derivar para los ingenieros, que tienen que pensar en "momentos de flexión" y "ejes neutros" y demás: pero nosotros los físicos que tenemos el beneficio de robar todo las golosinas de los matemáticos son capaces de simplemente "ver" la respuesta de lo que "debería ser" el lagrangiano.

Entonces, la primera definición es incorrecta de una manera importante.

Quiero decir, las definiciones per se no pueden estar equivocadas, pero pueden ser inútiles , y eso es precisamente lo que vemos arriba. Lo que queremos es poder decir "para los caminos que nos interesan, la derivada funcional de la acción con respecto al camino es cero", y la primera definición solo captura eso en el caso más común. En cambio, la segunda definición captura esto en un sentido más general.

La definición de Goldstein solo es apropiada para los funcionales que ocurren en la mecánica lagrangiana. La segunda definición es la definición matemática más general. Siempre que lo funcional sólo dependa de y y y son equivalentes, pero la introducción de derivadas superiores al primer orden invalidaría la primera definición.