Derivación correcta de las ecuaciones de Einstein a partir de la acción de Hilbert

He estado tratando de entender la relatividad general desde la perspectiva de los primeros principios en mi tiempo libre y no he podido encontrar una derivación convincente de las ecuaciones de Einstein. El más completo que puedo encontrar es el de Wikipedia , pero tiene una gran brecha matemática que no puedo resolver. Es decir, al calcular la variación del tensor de curvatura de Riemann, el autor asume que el operador de variación es una derivación, es decir, cumple la regla del producto para derivadas. Esto parece ser falso, porque la variación en cuestión no es en sí misma una derivada ordinaria, sino más bien la "derivada" de Euler-Lagrange, cuya definición para una función de la métrica (inversa) y sus dos primeros parciales (como el tensor de Riemann) es

d L ( gramo i j , k gramo i j , yo k gramo i j ) d gramo i j = L gramo i j k L ( k gramo i j ) + yo k L ( yo k gramo i j ) .

Los términos segundo y tercero no cumplen la regla del producto. Casi parece como si en la derivación vinculada el autor estuviera tomando parciales simples con respecto a la métrica inversa, lo cual es completamente incorrecto. Y, sin embargo, esa derivación está vinculada al libro de texto de Carroll, por lo que debe tener cierta credibilidad. No tengo el libro de texto, así que no puedo verificar si explica esta lógica de manera más completa. Por lo tanto recurro a Physics.SE. ¿Que está pasando aqui?

Su notación está un poco fuera de lugar aquí, debe tener un extra en el denominador del segundo y tercer término del lado derecho, ya que estás tomando la derivada con respecto a los gradientes.
@MichaelSeifert Ups, tienes razón.
Supongo que lo que más le preocupa es el d ( gramo R ) ¿término? Si es así, creo que tengo una respuesta.

Respuestas (3)

Lo que creo que te está haciendo tropezar aquí es el uso de la notación de derivadas parciales en el cálculo de variaciones. Por lo general, es mucho más fácil, especialmente cuando se realizan cálculos en GR, usar d notación de -operador en su lugar. (El d -el operador, por definición, obedece la regla del producto: d ( F gramo ) = F d gramo + gramo d F .) No obstante, he escrito los conceptos básicos de lo que está pasando aquí en su notación; Tengo que hacer un poco de chapuza al final (¡mira si puedes detectarlo!), pero puedes estar seguro de que escribir todo usando d -operators hace que todo sea un poco más riguroso.

Así que tomemos la derivada funcional del producto. F ( gramo , gramo ) GRAMO ( gramo , gramo ) :

d [ F ( gramo , gramo ) GRAMO ( gramo , gramo ) ] = ( F gramo i j d gramo i j + F ( k gramo i j ) d ( k gramo i j ) ) GRAMO ( gramo i j , k gramo i j ) + ( GRAMO gramo i j d gramo i j + GRAMO ( k gramo i j ) d ( k gramo i j ) ) F ( gramo i j , k gramo i j )
Los primeros términos de cada paréntesis (proporcional a F / gramo i j & GRAMO / gramo i j ) obviamente obedecen la regla del producto cuando se toman en conjunto, así que concentrémonos en los demás:
( F ( k gramo i j ) d ( k gramo i j ) ) GRAMO + ( GRAMO ( k gramo i j ) d ( k gramo i j ) ) F = k [ ( F ( k gramo i j ) GRAMO + GRAMO ( k gramo i j ) F ) d gramo i j ] k [ F ( k gramo i j ) GRAMO + GRAMO ( k gramo i j ) F ] d gramo i j
y así (descartando la derivada total) tenemos
d [ F ( gramo , gramo ) GRAMO ( gramo , gramo ) ] d gramo i j = GRAMO F gramo i j + F GRAMO gramo i j k [ F ( k gramo i j ) GRAMO + GRAMO ( k gramo i j ) F ] . ( 1 )
Este último término no será, como se observa en general, igual a
GRAMO k [ F ( k gramo i j ) ] F k [ GRAMO ( k gramo i j ) ]
como cabría esperar de la regla del producto.

Sin embargo, en el caso de la acción de Einstein-Hilbert, tenemos F = gramo y GRAMO = R . Desde k F = 0 (recuerde, realmente deberíamos estar usando derivadas covariantes arriba) y dado que F / ( k gramo i j ) = 0 , el segundo término en (1) se convierte en

k [ F ( k gramo i j ) GRAMO + GRAMO ( k gramo i j ) F ] = F k [ GRAMO ( k gramo i j ) ] = GRAMO k [ 0 ] F k [ GRAMO ( k gramo i j ) ] ,
que es lo que esperaría de la regla del producto. Una lógica similar se extiende al caso en que GRAMO (pero no F ) depende de las derivadas superiores de los campos.

Gracias por tu respuesta. No resuelve completamente mi problema, ya que, por ejemplo, en el primer paso en la prueba de Wikipedia, aplican la regla del producto a un producto de dos símbolos de Christoffel en lugar de simplemente gramo R , pero me ayudó a ver lo que estaba malinterpretando.

Creo que es importante entender qué es exactamente el diferencial funcional d está haciendo. tenemos un funcional S : mi R , dónde mi es un espacio vectorial de configuraciones de campo (campos de tensor suave o lo que sea). Tomamos una familia suave ψ ϵ de campos, donde ϵ ( d , d ) . Como ϵ varía, obtenemos una familia S ϵ = S ( ψ ϵ ) . Definimos d S / d ψ ( ψ 0 ) con la condición de que para cada una de esas familias con ψ 0 arreglado, tenemos

d S := d S ϵ d ϵ | ϵ = 0 = METRO d S d ψ ( ψ 0 ) d ψ , d ψ := d ψ ϵ d ϵ | ϵ = 0 .
Si S = L , entonces simplemente tenemos
d S d ϵ = METRO d L d ϵ m ,
dónde m es alguna medida que no depende de gramo . Configuración ϵ = 0 da
d S = METRO d L m .
Entonces d es de hecho una derivación porque es d / d ϵ .

Después de reflexionar sobre la respuesta de Michael Seifert, me di cuenta de cuál es la resolución completa de mi problema. El problema es que la expresión d L , que se define como

d L = L gramo i j d gramo i j + L ( k gramo i j ) k ( d gramo i j ) + L ( yo k gramo i j ) yo k ( d gramo i j ) ,

no se puede confundir con d L d gramo i j , a diferencia de los diferenciales. Esto se debe a que no tenemos la aproximación lineal.

d L = d L d gramo i j d gramo i j

como, de nuevo, tenemos para los diferenciales, pero más bien

d L = d L d gramo i j d gramo i j + i F i ,

para algunos vectores F i . Esta diferencia es lo que impide d L d gramo i j de ser una derivación. Haciendo todo el cálculo con el operador d en lugar de la derivada funcional d d gramo i j funciona muy bien. Esto es en realidad lo que se muestra en la página de Wikipedia; Simplemente asumí que el d -la notación diferencial era una abreviatura.