¿Cuál es la idea detrás del tensor de curvatura de Riemann?

El tensor de curvatura de Riemann se puede expresar usando los símbolos de Christoffel así:

R metro j k yo = k Γ metro yo j yo Γ metro k j + Γ metro k i Γ i yo j Γ metro yo i Γ i k j

¿Cómo se les ocurrió esto? ¿Cuál fue la idea?

Busqué en la web pero las descripciones que encontré eran demasiado formales y no pude descifrar lo que el autor intenta describir.

Así que estoy buscando algunas ideas o un documento fácil del que pueda partir y derivar esta fórmula yo mismo.

Se puede explicar usando transporte paralelo a lo largo de un camino cerrado o calculando el conmutador de la derivada covariante.
Probablemente no va a ser una cosa fácil de hacer, pero ¿por qué no empezar aquí "ellos" empezaron y tratan de resolver F ; β γ α F ; γ β α como mejor tú.
La idea es expresar la curvatura de una variedad de forma totalmente intrínseca, es decir, sin referencia a un vector normal. El hecho de que esto sea posible es algo sorprendente.
Parece más adecuado para matemáticas.SE.
@MBN La razón por la que quiero entender esto es que estoy construyendo mi camino hacia la relatividad general. Pensé que hay más gente aquí que puede ayudar con esto que allá.
Dado que conoce los símbolos de Christoffel y, por lo tanto, los derivados covariantes, quizás la intuición más simple es el resultado [ a , b ] V C = R a b C d V d .

Respuestas (5)

La idea es que queremos definir alguna noción de curvatura para una variedad que intuitivamente concuerde con la intuición que tenemos sobre la curvatura.

La idea genial que conduce a la definición deseada es la noción de transporte paralelo . Hablando aquí sin rigor, la idea básica es que si transportas un vector tangente en una variedad paralela a sí mismo alrededor de una curva cerrada, entonces el vector volverá a sí mismo en espacios planos, pero se convertirá en un vector diferente. en un espacio curvo.

Para ver por qué la noción de transporte paralelo tiene algo que ver con la curvatura, pensemos, por ejemplo, en el plano euclidiano. R 2 versus la esfera bidimensional S 2 .

Considere la curva que consiste en un triángulo equilátero con un vértice en el origen. Ahora imagina colocar un vector que emana del origen e imagina mover ese vector a lo largo del triángulo, manteniendo su "cola" en el triángulo y asegurándote de mantener el vector paralelo a sí mismo todo el tiempo. Si transportas el vector una vez alrededor del triángulo de regreso al origen de esta manera, obtienes el mismo vector nuevamente.

Algo drásticamente diferente sucede si haces lo mismo en la esfera como lo indica el siguiente diagrama de la página wiki sobre transporte paralelo

ingrese la descripción de la imagen aquí

Si mueve un vector desde el punto A hacia sí mismo a lo largo de la curva indicada en el diagrama, el vector no vuelve a sí mismo. Esto sucede porque la esfera es curva.

De hecho, la noción de transporte paralelo se puede utilizar para caracterizar completamente lo que entendemos por curvatura. La lógica que encontrará en muchos libros sobre GR y geometría diferencial es más o menos la siguiente:

  1. Defina la noción de una conexión (básicamente esto define lo que quiere decir al tomar derivadas en la variedad).

  2. Use la conexión para definir la noción de transporte paralelo que concuerda con nuestra intuición de transporte paralelo en, por ejemplo, el ejemplo de esfera anterior.

  3. Demuestre que existe un tensor que mide con precisión cuánto cambian las componentes de un vector cuando se transporta en paralelo a lo largo de una pequeña curva cerrada en la variedad.

  4. Llame a este tensor tensor de Riemann y utilícelo como el objeto que captura la noción de curvatura.

Hay una gran discusión sobre esto en muchos libros. Personalmente, me gusta la discusión en las páginas 36-38 de la Relatividad General de Wald .

Apéndice. Wald en realidad muestra que si considera una curva que limita un pequeño parche bidimensional parametrizado por coordenadas s y t en la variedad dada, entonces el cambio d v a en los componentes de un vector transportado a lo largo del límite de este parche satisface

d v a = d t d s v d T C S b R C b d C b d a
dónde d t d s es el área del parche, y T C y S b son las tangentes a las curvas de constante s y t respectivamente.

Leí en alguna parte que la idea de la curvatura es que transportas el vector alrededor de un pequeño parche, luego divides la desviación del vector por el área del parche. Tanto la desviación como el área serán minúsculos, usando la regla de L'Hôpital puedes obtener un vector de curvatura. ¿Es esto correcto? ¿Necesito transportar el vector a lo largo de las geodésicas para obtener el resultado correcto? ¿Cómo aplicas la idea de dimensiones más altas? Por ejemplo, ¿cómo transportas un vector alrededor de un cubo pequeño, por ejemplo?
@Calmarius Para su primera pregunta, consulte el apéndice de mi respuesta. No necesita transporte paralelo a lo largo de geodésicas. La idea se aplica a todas las dimensiones de la misma manera; la curva por la que se transporta en paralelo es unidimensional en todos los casos.
Así que básicamente tengamos 2 vectores para describir los lados de un paralelogramo en un punto, y tengamos un tercero para ser transportado a lo largo del paralelogramo. Entonces, si hago los cálculos y resto el vector resultante del original, debería obtener el tensor de curvatura de Riemann, ¿verdad?
@Calmarius Eso es básicamente todo con la advertencia de que debe considerar un pequeño paralelogramo.

Consulte la respuesta de Joshphysic para conocer los detalles; Me gustaría agregar algunos comentarios de "resumen". Las ideas esenciales y fundamentales aquí son:

  1. Desviación del postulado paralelo de Euclides (consulte la página Wiki "Postulado paralelo") ;
  2. Cómo los campos vectoriales "mal" en la variedad en cuestión no son integrables (consulte el prólogo de la página Wiki sobre "Tensor de curvatura de Riemann" ) a una isometría con una variedad verdaderamente euclidiana (es decir, R norte )

La desviación en (1) es nula si y solo si el tensor de curvatura y el tensor de torsión desaparecen. La desviación en (2) se mide por el tensor de curvatura como en la respuesta de Joshphysics por su "no holonomía" , es decir , cuánto varía un transporte paralelo de un vector de prueba alrededor de un pequeño bucle dividido por el "área" de ese bucle. El teorema fundamental de la geometría de Riemann muestra que siempre podemos definir una conexión única (la conexión de Levi-Civita) que absorbe la torsión en la curvatura, de modo que ambos conceptos anteriores se abordan completamente mediante R ( X , Y ) . La mayoría de los GR se realizan con esta opción, por lo que la torsión no se discute mucho. Pero aún vale la pena leer sobre esto a medida que aprende sobre la curvatura. La torsión adquiere un papel fundamental en la teoría de Einstein-Cartan, pero aquí solo dejo nombres porque, como el sargento Schultz, no sé nada sobre esto: este es un proyecto intelectual futuro para mí.

La referencia Wald de Joshphysic es buena, también me gusta el tratamiento de Schutz de las ideas como se da en el Capítulo 6 de sus "Métodos geométricos de física matemática" . Su última versión de "A First Course in General Relativity" es un poco liviana sobre estos conceptos, ya que tuvo que trasladar parte del material a su libro "Métodos geométricos" para dar paso a discusiones sobre GR experimental, que es un campo emocionante. en este momento.

De paso, vea algunos diagramas encantadores, vea esta respuesta que Bakhoda escribió para mí en Maths SE.

Si está dispuesto a trabajar un poco, puede consultar el capítulo 14 de "Road to Reality" de Roger Penrose (llamado "Calculus on Manifolds"). Simplemente leyendo esto le dará una buena comprensión de alto nivel. Si regresa y hace todos los ejercicios, su comprensión será bastante completa, aunque este es un gran proyecto.

Otra descripción básica de estas ideas se da en el capítulo 3 de las "Conferencias sobre geometría diferencial" de Wulf Rossmann . Puede descargar desde allí: Rossmann es un poco matemático Feynman: trabaja incansablemente para buscar las descripciones más claras y elementales de las cosas.

Para otra lectura con sabor a Penrose con los diagramas más magníficos y amorosamente dibujados que jamás hayas visto, las partes relevantes de Misner, Thorne y Wheeler son buenas, pero este es un volumen monstruoso y no lo tengo delante, así que puedo No te diré dónde encontrarlo. Pero debería ser bastante obvio si tienes en tus manos una copia.

@dj_mummy En mi opinión, la notación libre de coordenadas es esencial para comprender y aprender; los índices son demasiada información, pero los necesita; una regla general que funciona para mí es que necesitará índices para cálculos detallados (es como programar , puedes escribirlos y entenderlos tú mismo, ¡pero mucho menos algo hecho por otra persona!), libre de índices para hablar sobre ideas y pruebas sobre propiedades ("pruebas cualitativas"). Nunca he practicado la notación de diagrama funky de Penrose: parecen bastante prometedores.

Pensé en tomar un enfoque ligeramente diferente expresando lo anterior en términos de un primer curso de cálculo vectorial.

Supongamos que tiene una curva r ( t ) en R 3 . Puede ser una línea recta, un círculo, una hélice, una cicloide, etc.

Puede asociar a cualquier punto de una curva de buen comportamiento un vector unitario tangente T ^ = d r d t | d r d t |

A su vez se puede tener una unidad normal tal que, k ( t ) norte ^ = d T ^ d t dónde norte ^ es la unidad normal y k es la curvatura,

y unidad vectorial binormal B ^ = norte ^ × T ^ / | norte ^ × T ^ |

Se puede demostrar que d B ^ / d t = τ norte ^ dónde τ es torsión.

Usando la regla de la cadena, d r d t = d r d s d s d t dónde d s es la longitud de arco infinitesimal. Normalmente se supone d s / d t = 1 para mantener las matemáticas más fáciles. También tiene algunas implicaciones físicas interesantes con respecto a las pseudo fuerzas que pueden ayudar a dar una comprensión intuitiva de los efectos gravitacionales de un espacio curvo.

La curvatura se define como k ( t ) = d θ d s dónde d θ es una medida si el cambio infinitesimal en la dirección del vector unitario tangente, y nuevamente d s es la longitud de arco infinitesimal.

norte ^ , B ^ , y T ^ formar una base ortonormal centrada en la curva. Ciertas relaciones entre ellos se mantienen sin importar cómo cambien sus coordenadas, si la curva se gira sobre el eje z, se refleja en algún plano, se mueve a otro lugar en R 3 . Estos incluyen curvatura, vértices y otras características geométricas.

A d θ está implícito en el cambio en cualquier vector unitario. Los vectores que representan tanto la magnitud como la dirección, manteniendo la magnitud constante solo permiten un cambio en la dirección que se puede representar como un cambio de ángulo. Aquí hay 3 vectores unitarios para elegir, por lo que hay 3 posibles d θ s. Las derivadas de estos vectores unitarios son vectores expresables como esos vectores: Relaciones de curvatura de Frenet-Seret

Observe en estas ecuaciones que la derivada de los vectores de la izquierda es una combinación lineal de los vectores de la derecha. Si tuviéramos un vector columna hecho de los vectores base T i j =< norte , B , T > , la derivada de este vector columna con respecto a d s seria alguna "matriz" METRO multiplicado por T i j . El índice doble es necesario porque i selecciona cuál de los 3 vectores nos importa, y j representa qué componente de ese vector nos interesa.

Entonces d T i j d s = METRO T i j es una forma muy compacta de las ecuaciones de Frenet-Serret. Representa la curvatura dando información sobre las derivadas de los vectores unitarios.

En términos generales, esta entidad indexada 2 (llamada tensor de rango 2) es un vector de vectores, o un vector anidado. Entonces, en un sentido similar, es una matriz. Aparecen por todas partes, por ejemplo, está el tensor de tensión de Maxwell en electromagnetismo o el tensor de tensión en la ciencia de los materiales.

Un campo vectorial se asocia con puntos en R norte otro elemento en R norte .

En los sistemas de coordenadas no cartesianas, los vectores unitarios pueden cambiar de un punto a otro. Esto significa que tienen derivadas distintas de cero, lo que implica algún concepto de curvatura en juego. Esto a su vez significa que sus componentes cambian.

Γ b C a = el a t h componente de coordenadas C derivada del vector unitario b . Por ejemplo, en coordenadas esféricas, Γ θ θ r = 1 r Estos son los símbolos de Christofel del segundo tipo.

Los símbolos de Christofel tienen sus propios derivados que también tienen implicaciones con respecto a la curvatura.

Entonces, la curvatura se puede categorizar por los símbolos de Christofel y sus derivados. Mientras que los elementos de matriz se refieren a un par de fila/columna, para los símbolos de Christofel, necesitamos especificar qué componente de qué derivado de qué vector, lo que implica 3 índices. (A pesar de requerir 3 índices, no es en sí mismo un tensor, pero eso se puede diferir). Tomar la derivada de un tensor crea un tensor que tiene un índice más bajo adicional. El rango es el número de índices de un tensor. Así que la derivada del símbolo de Christofel tiene Rango 4.

Observe que el tensor de curvatura de Riemann es de rango 4. Observe también la forma que toma y compárela con la expresión de curvatura para una curva implícita: Curvatura de curva implícita . Encontrará que los tratamientos más formales usan curvas para ilustrar los principios en juego, básicamente generalizando desde los conceptos primitivos de curvatura de una curva a la curvatura de un Manifold.

Esto no ha sido especialmente riguroso, pero espero que ayude a desarrollar una intuición para los conceptos en juego.

La curvatura es un concepto tan importante en matemáticas y física que hay muchas formas de pensar al respecto. El más antiguo es el de curvatura gaussiana y el más moderno utiliza conceptos en haces vectoriales y principales.

Curvatura gaussiana

Comencemos con la curva más simple. Esta es la línea recta y obviamente la curvatura debe ser cero, es decir, no tiene curvatura. La siguiente curva más simple es el círculo. Es el más simple aquí porque es 1d y sea cual sea la curvatura que le asignemos, podemos ver que esta curvatura es la misma en todos los puntos del círculo.

La pregunta es ¿qué curvatura debemos asignarle? Un círculo tiene un solo número asociado a él y ese es el radio. Por supuesto, hay otros números asociados con el círculo, como su área o su circunferencia, pero todos dependen completamente del radio. La medida obvia de la curvatura que podemos tomar es simplemente el recíproco de la curvatura, es decir, 1/r . Vemos que cuando el radio aumenta hasta el infinito, la curvatura se vuelve cero. Y esto tiene sentido porque el arco del círculo en ese punto se aproxima a una línea recta.

Ahora podemos ver cómo evaluar la curvatura de una curva arbitraria. Elegimos un punto y ajustamos un círculo a ese punto que es tangente a él, en algún sentido, y luego decimos que la curvatura de la curva es la curvatura del círculo que ajustamos a él.

La siguiente cuestión a abordar es cómo evaluar la curvatura de una superficie en un punto p . Bueno, tomamos un avión a través de la superficie allí. Esto nos dará una curva y podemos tomar la curvatura de esta curva. Sin embargo, este plano era arbitrario, así que tomemos cada plano a través de este punto y evaluemos la curvatura de cada curva que da. Obviamente, hay un mínimo y un máximo de estas curvaturas y se denominan curvaturas principales, k 1 , k a pag pag a 2 . La curvatura gaussiana es su producto, k 1 , k a pag pag a 2 . Ahora, lo que Gauss descubrió es que esta curvatura es intrínseca a la superficie y no depende de cómo la superficie esté incrustada en el espacio. Esto lo impresionó tanto que lo llamó el Teorema Egregium (el teorema notable). Tenía razón al estar impresionado, ya que es esta propiedad de la curvatura gaussiana, generalizada de muchas maneras, la que informa el concepto moderno, y en particular el GR de Einstein y más allá, en la física de partículas: todas las fuerzas en el modelo estándar: el electromagnético, la fuerza débil y fuerte pueden entenderse en términos de curvatura (de haces principales).

Obviamente, para GR necesitamos evaluar la curvatura para variedades de 4 dimensiones y no solo para superficies. Usamos un truco similar al que acabamos de hacer. Tome un punto p en una variedad, de cualquier dimensión. Entonces en este punto tiene un espacio tangente. Ahora elegimos un plano que pasa por este punto y esto determina una superficie en la variedad que pasa por este punto y que tiene este plano como plano tangente y tomamos la curvatura gaussiana de esta superficie en este punto. Esto nos da un conjunto de curvaturas asociadas con todos los planos que podemos colocar a través de este punto en este punto. Esta curvatura se llama curvatura seccional. Y resulta que la curvatura de la sección determina y está determinada por la curvatura de Riemann.

Curvatura de Riemann

Esto tiene una definición simple pero abstracta. se define como

R ( tu , v ) := [ tu , v ] [ tu , v ]

Está midiendo la no conmutatividad de los vectores tangentes en la variedad; o alternativamente, la pérdida de transporte paralelo cuando nos movemos alrededor de un pequeño paralelogramo.

Resulta que en un punto p si elegimos dos vectores tangentes u,v allí entonces

( R ( tu , v ) w , z ) = ( 1 / 6 ) ( d 2 / d s . d t ) [ k ( tu + s z , v + t w ) k ( tu + s w , v + t z ) ] en el punto ( s , t ) = 0

Donde K es la curvatura de la sección y podemos ver que el lado izquierdo también mide la no conmutatividad en algún sentido.

Sin embargo, el tensor de curvatura de Riemann es mucho más conveniente: es un tensor y satisface tres propiedades de simetría simples y su definición abstracta, aunque abstracta, es directa y fácil de generalizar (¡en el sentido apropiado!) a otros contextos a diferencia del definición concreta y geométrica de la curvatura gaussiana que es bastante complicada. Este tipo de cosas ocurre muy a menudo en matemáticas y física.

Otra forma de comparar los dos es evaluarlo en una situación simple y la más simple es la de una superficie donde:

R a b C d = k ( gramo a C . gramo d b gramo a d . gramo C b )

Donde K=R/2 es la curvatura gaussiana y, de hecho, también la curvatura seccional. Es igual a la mitad de la curvatura escalar R , que es solo la contracción completa del tensor de Riemann. (Tenga en cuenta que gramo a b es la métrica.)

Conexiones

Para definir la curvatura de Riemann necesitamos una métrica en la variedad. Esta es una forma de medir longitudes y ángulos. Sin embargo, resulta que podemos salir con menos. Todo lo que necesitamos es una conexión que nos diga cómo transportarnos en paralelo de un punto a otro, es decir, conecta espacios tangentes. Una noción equivalente es la holonomía que nos dice cómo cambian los vectores tangentes si los transportamos alrededor de pequeños bucles.

Según la respuesta de @R.Romero a esto, en el espacio 3D, los símbolos de Christoffel especifican el pequeño cambio gradual en la dirección y la longitud de cada uno de los vectores de base de 3 unidades Tangente, Normal y Binormal medidos desde el objeto mismo, con origen [0,0,0] también en el propio objeto:

T , norte , B

hábilmente expresado en términos de las longitudes medidas usando estos mismos vectores unitarios T, N, B en este momento de iteración exacto, lo que nos da una matriz total de 3x3 que nos dará el siguiente conjunto de dirección y longitud del eje T, N, B que podemos usar en la siguiente iteración de paso de tiempo, ¿es correcto? Luego, este proceso se repite, por lo que tenemos números que cambian constantemente en una matriz de 3x3 (que se define como el tensor de Riemann) a medida que avanzamos en el espacio.

Entonces, en el espacio-tiempo 4D, esto se generalizará a una matriz 4x4 ya que hay 4 vectores base especificados en cada punto del espacio-tiempo.

Pero como los vectores base

T , norte , B
siga cambiando cada instante siguiendo la orientación del objeto en sí (es decir, en cualquier momento el objeto siempre estará mirando hacia adelante a lo largo del vector unitario Tangente (velocidad), con los vectores unitarios Normal y Bi-normal completando una cuadrícula ortonormal a su alrededor), ¿Cómo es posible relacionar este sistema de coordenadas en constante cambio centrado en el objeto con un sistema de coordenadas fijo de una "cámara" que está mirando el objeto que se mueve en el espacio?