Tensor métrico en relatividad especial y general

Tengo problemas para entender el tensor métrico en relatividad general. Lo que he entendido hasta ahora proviene de las notas de mi curso utilizadas junto con "El camino a la realidad" de Roger Penrose.

Problema 1

Sé que en relatividad especial, la matriz

η a b = ( 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 )

es el tensor métrico, pero que yo sepa, "el tensor métrico" es solo un nombre para esa matriz. Ahora he aprendido que, en general, el tensor métrico es la matriz gramo a b = mi a mi b dónde mi a = d σ d X a , y σ ( X 1 , X 2 , ) es una superficie paratremizada por el X α . Entonces, esto implicaría que la "superficie" en la relatividad especial (supongo que esto es lo que significa "espacio-tiempo") es de 4 dimensiones y sus vectores mi 1 , mi 2 , mi 3 , mi 4 son ortogonales. Pero también para mi α mi 0 , tenemos

mi α mi α = | mi α | 2 porque ( 0 ) = 1 , ya que un vector es paralelo a sí mismo. Este es mi primer problema, ya que el módulo de un vector no debería ser negativo. Estoy asumiendo estos vectores mi α están en coordenadas cartesianas.


Problema 2

Entonces sí v es un vector en esta superficie, escrito en las coordenadas de la superficie de modo que v = v α mi α , entonces v v = ( v α mi α ) ( v β mi β ) = ( mi α mi β ) v α v β = η α β v α v β . Esto tiene sentido para mí si la matriz de identidad I 3 es el tensor métrico para coordenadas cartesianas tridimensionales (que supongo que lo es), de modo que para v = ( a , b , C ) el producto punto se convierte v v = a 2 + b 2 + C 2 . Estoy un poco confundido acerca de cómo el símbolo se utiliza aquí - en el caso de mi α mi α parece ser el producto punto cartesiano estándar, pero en el caso de v v que no es; simplemente multiplicar los componentes correspondientes aquí sería incorrecto.


Problema 3

Mi tercer problema es que no estoy seguro de dónde está la ecuación d s 2 = gramo a b d X α d X β viene de. ¿Es esta la definición de d s 2 , y si es así, es d s 2 conservado en todos los sistemas de coordenadas, como es el caso de la relatividad especial? Si η a b como se definió anteriormente se llama el tensor métrico en la relatividad especial, entonces, ¿también se conserva en todas las coordenadas? Por la definición del tensor métrico, no puedo ver por qué debería ser así.

Disculpas por la falta de claridad, y gracias por cualquier ayuda!

Editar: un ejemplo de una pregunta de examen que me gustaría poder entender: pregunta (imagen alojada en Dropbox)

Respuestas (2)

Empecemos desde el principio:

El escenario de la relatividad, ya sea especial o general, es que el espacio-tiempo es una variedad METRO , es decir, algo que es localmente homeomorfo al espacio cartesiano R norte ( norte = 4 en el caso de la relatividad), pero no globalmente.

Tales variedades poseen un espacio tangente T pag METRO en cada punto, que es donde viven los vectores de los que se suele hablar. Si elige coordenadas X i en la variedad, entonces el espacio de vectores tangentes es

T pag METRO := { i = 0 3 C i X i | C i R }

Cuando decimos que una tupel ( C 0 , C 1 , C 2 , C 3 ) es un vector, queremos decir que corresponde al objeto C i i T pag METRO en algún momento pag METRO .

Una métrica en METRO se puede dar especificando una forma bilineal no degenerada en cada punto

gramo pag : T pag METRO × T pag METRO R

Lo que aprendió "en general" es que los componentes de la métrica son, para los vectores base elegidos i de T pag METRO , definido por gramo i j = gramo ( i , j ) . Ahora puede ver la métrica como una especie de producto escalar, configurando X Y := gramo ( X , Y ) para dos vectores X , Y . (Esto contiene la respuesta a su segundo problema) Pero para variedades no riemannianas, es decir, variedades donde no todas las entradas en la métrica son positivas, este no es un producto escalar en el sentido al que puede estar acostumbrado. En particular, puede ser cero . Los vectores para los que es cero se denominan generalmente similares a la luz o nulos .

Lo importante a tener en cuenta es que las variedades no siempre se comportan como el espacio cartesiano.

Ahora, para tu tercer problema, necesitamos el concepto del espacio cotangente T pag METRO . Es el espacio vectorial dual al espacio tangente, atravesado por las diferenciales d X i : T pag METRO R para un sistema de coordenadas elegido, y definido por

d X i ( j ) = d j i

Ahora, recuerda que la métrica era un mapa del doble del espacio tangente a R . Como tal, podemos verlo como un elemento del producto tensorial T pag METRO T pag METRO , que es el espacio ocupado por el elemento de la forma d X i d X j . Como la métrica es un elemento de este espacio, es ampliable en su base:

gramo = gramo i j d X i d X j

donde el físico simplemente deja caer lo molesto firmar. Ahora, ¿qué tiene esto que ver con la distancia infinitesimal? Simplemente definimos la longitud de un camino γ : [ a , b ] METRO estar con γ ( t ) que denota el vector tangente al camino) [ 1 ]

L [ γ ] := a b | gramo ( γ ( t ) , γ ( t ) ) | d t

Y, al usar la notación descuidada de los físicos, gramo ( γ ( t ) , γ ( t ) ) = gramo i j d X i d t d X j d t , si entendemos X i ( t ) como el i -ésima coordenada del punto γ ( t ) , y entonces:

L [ γ ] = a b gramo i j d X i d t d X j d t d t = a b gramo i j d X i d X j d t d t = a b gramo i j d X i d X j

Desde que llamamos d s el elemento de línea infinitesimal que cumple L = d s , esto sugiere la notación

d s 2 = gramo i j d X i d X j

Si notamos que, por la definición de vectores tangentes y cotangentes por diferenciales y derivadas como arriba, las cosas con índices superiores se transforman exactamente de manera opuesta a las cosas con índices inferiores (ver también mi respuesta aquí ), se ve que esto es de hecho invariante bajo transformaciones de coordenadas arbitrarias.

[ 1 ] γ ( t ) es realmente un vector tangente en el siguiente sentido:

Dejar X : METRO R norte ser un gráfico de coordenadas. Considere entonces: X γ : [ a , b ] R norte . Dado que es una función ordinaria entre (subconjuntos de) espacios cartesianos, tiene una derivada

( X γ ) : [ a , b ] R norte

Ahora, ( X γ ) i ( t ) ser considerado como los componentes del vector tangente γ ( t ) := ( X γ ) i ( t ) i T γ ( t ) METRO . Es un ejercicio algo tedioso, pero que vale la pena, mostrar que esta definición de γ ( t ) es independiente de la elección de las coordenadas X .


Su pregunta de examen con las superficies está preguntando sobre algo diferente. Se le da una incrustación de una subvariedad de dimensiones inferiores norte en el espacio cartesiano

σ : norte R norte

y se le pidió que calculara la métrica inducida en la subvariedad a partir de la métrica cartesiana

d s 2 = i = 1 norte d ( X i ) 2

(que es solo la matriz de identidad en forma de componente con cualquier base ortonormal de coordenadas en R norte , es decir, el producto escalar)

Ahora bien, ¿cómo se induce una métrica? Dejar y : R metro norte ser las coordenadas para la subvariedad (en realidad se le da σ y en la pregunta), y X sean las coordenadas del espacio cartesiano. Observe que cualquier morfismo de variedades σ induce un morfismo de espacios tangentes

d σ pag : T pag norte T σ ( pag ) R norte , y i j ( σ y ) j y i X j

llamado diferencial de σ . Como morfismo de espacios vectoriales, es una función lineal dada, como matriz, por el jacobiano d σ i j := ( σ y ) j y i del morfismo de las variedades. Ahora, inducir una métrica significa establecer

gramo norte ( y i , y j ) := gramo mi tu C yo i d mi a norte ( d σ ( y i ) , d σ ( y j ) )

En el lado derecho está ahora el producto escalar de dos vectores ordinarios en R norte , y como se llaman tus examenes mi y i es mi d σ ( y i ) . Si notas que te dan σ y , entonces todo lo que necesita hacer es calcular los componentes métricos calculando gramo norte como arriba para cada combinación posible de y i , y j (en 2D, afortunadamente, solo hay cuatro).

¡Gracias por la respuesta detallada! Ha sido muy útil hasta ahora, pero estoy un poco confundido por la definición del espacio tangente. A sus elementos los llamas vectores, pero los elementos son combinaciones lineales de derivadas parciales, y un vector como γ ( t ) no es solo una combinación lineal de derivadas parciales, pero pertenece al espacio tangente?
@ACuriousMind: " Comencemos por el principio: el escenario de la relatividad [...] es que el espacio-tiempo es una variedad METRO [...] que los componentes de la métrica [ tensor ] son, para los vectores base elegidos d i de T pag METRO , definido por gramo i j = gramo ( d i , d j ) . [...] puede ser cero. Los vectores para los que es cero se denominan generalmente similares a la luz . " -- ¿Hay alguna razón (que tenga que ver con los participantes, las observaciones, la física) para asociar el caso de los valores del componente " cero " con la " luz "? Si es así, ¿existen razones correspondientes con respecto a los casos de otros valores de los componentes?
@James Machin: He agregado respuestas a sus preguntas a mi respuesta. De hecho, también se podría definir el espacio tangente a través de las clases de equivalencia del ( X γ ) de todas las curvas γ , como se puede ver en la página de Wikipedia del espacio tangente.
@user12262: Tales vectores se llaman lightlike porque si γ es la línea de tiempo de algo que viaja a la velocidad de la luz, entonces gramo ( γ ( t ) , γ ( t ) ) = 0 en cada punto del camino. De manera similar , la nomenclatura espacial y temporal surge de que los vectores correspondientes son tangentes a las líneas de mundo de los viajeros FTL y los viajeros sublumínicos, respectivamente.
@ACuriousMind: " [1] [...] una función ordinaria entre (subconjuntos de) espacios cartesianos, [...] tiene una derivada " -- Seguramente no todas las funciones
R R norte
tiene una derivada. Sin embargo, tal vez funciones como
( X γ ) : [ a , b ] R norte ,
es decir, como se considera en la respuesta, puede tener propiedades adicionales (más fuertes) que pueden (o no) implicar la existencia de un derivado.
@ACuriousMind: " si γ es la línea de tiempo de algo que viaja a la velocidad de la luz, entonces gramo ( γ ( t ) , γ ( t ) ) = 0 en cada punto del camino. "- ¿Cómo es eso? ¿Qué quiere decir con " velocidad " (es decir, una noción que aparentemente no se ha mencionado en su respuesta, tal como está actualmente)? ​​...
@ user12262: Es cierto, pero no quería sobrecargar una respuesta para (alguien que me parece) un principiante con tales tecnicismos. Se supone que la variedad es una variedad suave, por lo que los gráficos y las rutas también son suaves. En cuanto a la velocidad, no la mencioné en mi respuesta, ya que no es necesario que esta pregunta discuta las razones de la nomenclatura similar al espacio/la luz/el tiempo, y sería necesario repetir la idea de marcos inerciales y cualquier cosa.
@ACuriousMind: -- Bueno, ciertamente he expresado las razones de mi insatisfacción; y una cita apropiada sobre cómo hacerlo mejor. Además, esperaré otro día para que el OP (James Machin) edite el título de la pregunta (al menos) antes de sugerirme las ediciones correspondientes.
Nunca antes había visto esa definición de vector. En realidad, ¡no puedo entenderlo en absoluto!
@James Machin: ¿Está familiarizado con la definición axiomática abstracta de un espacio vectorial ? Uno se acostumbra a estas cosas trabajando con ellas durante tanto tiempo que puede recitarlas mientras duerme. Además, tenga en cuenta que mi explicación tiene una visión bastante abstracta: hay formas de presentar estas cosas de manera más "intuitiva", pero no soy bueno en ellas y barren la estructura matemática debajo de la alfombra, que necesitará pronto. o después.
Además, para visualizar cosas sobre las variedades, a menudo me resulta útil pensar en la vieja y buena esfera, que es la mejor variedad posible. Los vectores tangentes son realmente lo que su nombre dice: son tangentes a la esfera, que puedes "ver" cuando piensas en cómo interpretarías un cambio infinitesimal en X i - al que el i corresponden - geométricamente. Es difícil transmitir tal intuición sobre las palabras, y tampoco estoy suponiendo que esté haciendo un buen trabajo en eso. Tal vez alguien más le proporcione una respuesta que se adapte mejor a usted :)
Creo que entiendo la idea de un espacio vectorial, donde abstraes la definición de un vector a un elemento de grupo que obedece las propiedades en el enlace de wikipedia, y puedo ver que el espacio vectorial tangente que definiste anteriormente satisface estas propiedades (bueno, no lo he comprobado, ¡pero supongo que sí!). Pero un vector tangente a una curva γ ( t ) es también un vector en el sentido estándar, es decir, si γ ( t ) = ( t , 2 t , 3 t 2 ) entonces γ ( t ) = ( 1 , 2 , 6 t ) , supongo que mi problema es que no puedo ver cómo γ ( t ) corresponde a una derivada parcial. ¡Debo agregar gracias por toda la ayuda hasta ahora!
@James Machin: ¡Oh, eso! Bueno, no quise dar a entender que hay algo intrínseco en γ que dice que es una derivada parcial. Es solo que METRO no es un espacio vectorial, entonces γ necesita un espacio para vivir, y por eso lo mandas al espacio tangente. Si llamas al espacio γ vive de forma nativa en V , entonces es naturalmente isomorfo a R norte , que es naturalmente isomorfo a T pag METRO . El mapa que doy en la nota al pie es la descripción explícita de ese isomorfismo.
@ACuriousMind excelente respuesta; ¡muy claro y bastante autónomo! +10 si pudiera
Supongo que lo que encuentro complicado es conectar esto con mi curso; después de todo, ¡tengo que ser capaz de responder las preguntas del examen! Al mirar las preguntas, se nos da una superficie como σ ( θ , ϕ ) y luego calcular la matriz métrica por la definición gramo a b = mi θ mi ϕ , dónde es el producto punto como en la suma del producto de los componentes, y mi θ := d σ d θ Estoy tratando de entender cómo su definición de la métrica se convierte en eso. Lo siento, no estoy siendo muy claro, ¡pero la mayoría de estos conceptos están más allá de mí!
@James Machin: solo por la información que ha proporcionado, diría que es una pregunta de examen bastante estúpida (al menos como preparación para SR/GR). Cómo es σ ¿dado? es una funcion R 2 R norte , ( θ , ϕ ) σ ( θ , ϕ ) ? En caso afirmativo, lo que está buscando es la "métrica inducida en una subvariedad" y puedo agregar eso a mi respuesta.
@ACuriousMind Agregaré un enlace a mi pregunta para dar una pregunta de ejemplo
@James Machin: " Estoy tratando de entender cómo su definición [de ACuriousMind] de la métrica [ tensor ] " -- es decir
L [ γ ] := γ d s
Juntos con
γ : [ a , b ] METRO
y
L [ γ ] := a b gramo j k   d X j   d X k
" se convierte en eso " -- es decir
L [ γ ] = a b   d   t   γ   límite Γ X { a γ 1 [ Γ ] d s a γ 1 [ X ] d s γ 1 [ Γ ] γ 1 [ X ] } .
-- Yo también. (Pero eso va un poco más allá de las " preguntas de examen "...)
@James Machin: Agregué una parte que analiza la inducción de una métrica a partir de una incrustación que se le proporciona.
@user12262: En realidad, no he definido la métrica de longitud de la ruta aquí, ya que eso requiere la introducción de geodésicas y el mapa exponencial. Me parece que no está satisfecho porque no he dado un curso completo de (pseudo-) geometría diferencial Riemanniana, y eso es cierto. Solo introduje las partes y extremos que se necesitan para comprender la pregunta en cuestión, y que es más probable que aparezcan en los escenarios típicos de GR.
@ACuriousMind: " Me parece que no está satisfecho porque no he dado un curso completo de (pseudo-)riemanniano [DG...] " -- En absoluto; su introducción ("Al principio... tenemos una variedad METRO ") es todo lo completo que se puede esperar. No estoy satisfecho porque ese no es el comienzo de la física , ni de (G)TR en particular. (Pero James Machin primero tiene que aprobar un curso, para ganarse el tiempo libre de tales consideraciones. ..) " la métrica de longitud de camino [...] requiere [...] geodésicas y el mapa exponencial. " -- Tal sobrecarga parece superflua para ciertas curvas λ con L [ λ ] = 0 .

Este es mi primer problema, ya que el módulo de un vector no debería ser negativo.

Primero, si bien hay muchas propiedades útiles del álgebra lineal introductoria que debe tener en cuenta con GR, pensar en términos cartesianos con matrices definidas positivas simplemente tiene que desaparecer. Los vectores en relatividad pueden tener una norma negativa.

Aunque no se hace a menudo en la literatura, podría ser pedagógicamente útil escribir la magnitud de X como X en vez de | X | , este último recuerda demasiado a la función de valor absoluto.


Estoy un poco confundido acerca de cómo el símbolo se usa aqui...

Este es otro problema con la notación. Érase una vez, en un entorno no físico, me enseñaron que dos vectores X y y vivir en un espacio de producto interno podría calcular su producto interno, ( X , y ) . En el caso de un producto interno muy especial, el producto escalar, podríamos calcular el valor sumando los productos por pares de los componentes de los vectores, y llamamos a este resultado X y .

En relatividad, sin embargo, nunca usamos este producto escalar cartesiano. 1 Por lo tanto, elegimos hacer que este símbolo signifique "aplicar la métrica a los vectores": X y = gramo ( X , y ) .

Si miras los componentes de X y y , la linealidad de gramo significa que se puede expresar como una matriz con componentes gramo m v , dónde gramo ( X , y ) se entiende que se calcula como "matriz-multiplicar el vector fila de componentes X m con la matriz con componentes gramo m v con el vector columna de componentes y v ." Usando la notación de suma implícita de Einstein, podemos escribir esto como X m gramo m v y v , o mejor aún gramo m v X m y v .

En realidad, debido a que tenemos una métrica, tenemos un espacio dual natural para nuestro espacio vectorial. Para cualquier X , existe un único mapa lineal X ~ en el espacio vectorial tal que X ~ ( y ) = gramo ( X , y ) para todos los vectores y . De este modo " X y " puede interpretarse como la habitual "suma de los resultados de la multiplicación por componentes" siempre que se entienda que estamos tomando las componentes del vector dual X ~ junto con los del vector normal y (y que la base para el espacio dual es el uso dual del espacio vectorial original).

Si la métrica es cartesiana, entonces la representación de la matriz es la matriz de identidad, por lo que la primera interpretación de la notación se reduce al producto escalar estándar de no pensar demasiado. En el lenguaje de los espacios duales, una métrica cartesiana induce un mapa trivial de los vectores a sus duales: los componentes siguen siendo los mismos. Por lo tanto, uno ni siquiera lleva la cuenta de si tomamos componentes de X o X ~ .


Mi tercer problema es que no estoy seguro de dónde está la ecuación d s 2 = gramo α β d X α d X β viene de.

Hay mucha geometría diferencial profunda detrás de esta declaración, y solo daré un breve vistazo a ella. Para cada índice m , X m es un campo escalar en su variedad de espacio-tiempo. El operador derivado exterior d convierte los escalares en vectores duales (entre otras cosas) y, en este caso especial, es realmente el conocido operador de gradiente.

Considere un punto en el espacio-tiempo. En este punto, sus coordenadas inducen derivadas direccionales / X m = m , y estos pueden tomarse como base para los vectores en ese punto. De hecho, el espacio dual tiene como base correspondiente los gradientes d X m . 2

Por la definición de la base dual, sabemos que d X m ( v ) = d v m . Considere un vector V = V α α . Sabemos d X m ( V ) = V α d X m ( α ) = V α d α m = V m . (La primera igualdad proviene de la linealidad de d X m ; véase también la nota al pie 2 ). Por lo tanto, en cualquier base fija,

gramo ( V , W ) = gramo α β V α W β = gramo α β d X α ( V ) d X β ( W ) = gramo α β d X α d X β ( V , W ) .

El símbolo único e indivisible" d s 2 " es solo una abreviatura para el tensor gramo α β d X α d X β (a menudo escrito sin el símbolo explícito del producto). Entonces, de una manera muy indirecta, esa es su definición. Y es tan invariante en coordenadas como el producto interno gramo .


1 Tenga en cuenta que algunos textos intentarán usarlo, al agregar factores de i en varios lugares para obtener los signos negativos deseados cuando dos i es multiplicar. Esta es una mala práctica y falla miserablemente cuando se pasa de SR a GR.

2 Posible punto de confusión: m en este párrafo solo se indexan diferentes coordenadas, no componentes de vectores o vectores duales. Además, se han suprimido las flechas y las tildes. De este modo m es vector completo para cualquier m , con componentes m α indexado por α . Similarmente, d X m es un vector dual, y sus componentes en alguna base entendida serían d X α m .

¡Muchas gracias por la respuesta detallada! Tu respuesta a las partes 1 y 2 realmente ayudó. En cuanto a la tercera parte, tengo el mismo problema que tuve con la respuesta a continuación: ¡no puedo entender cómo las derivadas parciales pueden ser una base para los vectores! ¡Hasta donde yo sé, los vectores tangentes no son combinaciones lineales de derivadas parciales! ¿No es necesario que una base para los vectores tangentes consista en vectores? No entiendo cómo las combinaciones finitas de entidades infinitesimales pueden crear un vector.
Es común en geometría diferencial identificar vectores con derivadas direccionales. Es una especie de definición de último recurso: si su variedad fuera un espacio vectorial, podría tomar X / X α y obtener un vector porque X es un elemento de un espacio vectorial. Cuando las posiciones ya no son elementos de espacios vectoriales, esa noción se desmorona. Sin embargo, las propias derivadas direccionales siguen obedeciendo la estructura del espacio vectorial.