¿Cuáles son los axiomas exactos para definir de manera única el tensor métrico de Minkowski como un mapa bilineal?

He leído que la definición de un tensor métrico es un mapa con los siguientes axiomas:

  • una forma bilineal desde el espacio vectorial tangente (de una variedad suave) al campo real
  • simétrico
  • no degenerado

[ Pregunta ] Ahora, desde una perspectiva puramente matemática: dado un mapa X (definido en un espacio tangente 4D), es suficiente decir que:

  • X es un tensor métrico
  • X tiene firma ( , + , + , + ) o ( + , , , )

deducir que X es el tensor métrico de Minkowski?

Nota: si la respuesta es sí, significaría que Minkowski es el único tensor métrico que como forma bilineal tiene la firma ( , + , + , + ) .

Creo que estos axiomas no son suficientes, porque en GR trabajamos con tensores métricos con la misma firma (ver esta pregunta ). Por lo tanto:

[ Subpregunta parte a ] ¿Qué axiomas adicionales debemos incluir para definir de manera única el tensor métrico de Minkowski como un mapa?

[ Subpregunta parte b ] ¿El axioma adicional simplemente estaría declarando explícitamente que los coeficientes de la forma bilineal son todos 1 (por lo tanto, -1,+1,+1,+1)?

¿Está permitiendo transformaciones de similitud en su definición de lo que "es" la métrica de Minkowski? Cualquier forma bilineal cuyos componentes (en una base dada) son
[ a 2 0 0 0 0 b 2 0 0 0 0 C 2 0 0 0 0 d 2 ]
tiene firma ( , + , + , + ) . Pero solo es igual a la métrica de Minkowski (en esta base) si a = b = C = d = 1 .
O, para otro ejemplo, considere la forma bilineal con componentes
[ a 2 + C 2 a b + C d 0 0 a b + C d b 2 + d 2 0 0 0 0 1 0 0 0 0 1 ]
que es lo que obtienes cuando aplicas una transformación de similitud arbitraria en el t y X coordenadas de la métrica de Minkowski. ¿Sigue siendo esta la métrica de Minkowski según su definición?
El espacio-tiempo de Minkowski es un espacio afín de cuatro dimensiones cuyo espacio vectorial de traslaciones está equipado con una forma bilineal no singular con firma -,-,-,+.
@MichaelSeifert ¡Hola! En mi pregunta, no estoy definiendo la métrica de Minkowski porque eso sería un razonamiento circular de mi parte: estoy pidiendo a los lectores que definan qué es , diciéndome cuáles son sus axiomas. La idea es pretender que ni siquiera sé qué es la métrica de Minkowski, y que los lectores me digan qué es, definiendo los axiomas que caracterizan de manera única el mapa. (¿Los axiomas que escribí son suficientes para hacerlo, o son más necesarios? Si es así, ¿cuáles?)
@ValterMoretti ¡Hola! Estoy preguntando los axiomas de la forma bilineal, no del espacio-tiempo. Sin embargo, puedo deducir de su definición que para usted la respuesta a mi pregunta es y, por lo tanto, según usted, el tensor métrico de Minkowski es el único tensor métrico que, como forma bilineal, tiene la firma (-, +, +, + ).
En realidad no, puede tener diferentes tensores métricos con la misma firma en un espacio vectorial dado. Así que tienes diferentes estructuras de espacio-tiempo de Minkowski en el mismo espacio afín de cuatro dimensiones.
@ValterMoretti en este caso, ¿podría responder la pregunta que publiqué, que trata sobre lo que define de manera única el mapa del tensor métrico de Minkowski? (posiblemente de forma axiomática, como hice en la pregunta)
Supongo que mi pregunta se reduce a "¿Qué quieres decir con definir ?" Si desea una definición única de una forma bilineal, debe tener una noción de cuándo dos formas bilineales son "iguales" y cuándo son "diferentes". Entonces, ¿son dos formas bilineales "lo mismo", según usted, si una se puede obtener de la otra mediante una transformación de similitud en el espacio subyacente? Obtendrá diferentes definiciones dependiendo de la respuesta a esta pregunta.
@MichaelSeifert sobre su pregunta para definir "definir", se lo dejo a los lectores; Personalmente, no sé qué suelen hacer los físicos (y/o los matemáticos) cuando definen de forma única una forma bilineal.
@TrentKent6 para definir de manera única una forma escalar lorentziana, es necesario y suficiente seleccionar una base (como un conjunto ordenado de vectores) del espacio de las traducciones y declarar que el producto escalar asume allí la representación matricial d i a gramo ( 1 , + 1 , + 1 , + 1 ) .

Respuestas (4)

Salvo isomorfismos , el espacio-tiempo de Minkowski es un espacio afín tetradimensional real METRO 4 equipado con un producto escalar lorentziano gramo en el espacio vectorial V 4 de traslaciones del espacio afín.

Si V es un espacio vectorial real de cuatro dimensiones, un producto escalar lorentziano es un mapa bilineal simétrico gramo : V × V R cuya forma canónica de Silvestre es diagnóstico ( 1 , + 1 , + 1 , + 1 ) .

Dado un espacio vectorial real de cuatro dimensiones V y una base vectorial mi 1 , mi 2 , mi 3 , mi 4 , existe un producto escalar lorentziano único cuya representación matricial sobre esa base es diagnóstico ( 1 , + 1 , + 1 , + 1 ) .

Por lo tanto, para fijar de manera única un producto escalar lorentziano basta con señalar una base y declarar que el producto escalar tiene la forma canónica en esa base.

Por otro lado, si tiene un producto escalar lorentziano, hay infinitas bases como las anteriores. Estas bases especiales están relacionadas entre sí a través de las transformaciones del grupo de Lorentz. (Esa es la definición del grupo de Lorentz).

Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .
¿Cuál es la diferencia entre decir que el producto escalar tiene diag(−1,+1,+1,+1) como forma canónica de Sylvester (como lo hace en su respuesta) y decir que los coeficientes de la forma bilineal son (-1 ,+1,+1,+1) (como hago al final de mi pregunta)?

Dejar pag ser un punto en la variedad. Por medio de transformaciones de coordenadas, cualquier tensor métrico lorentziano se puede poner en la forma diagnóstico ( + + + ) en pag por definición. Por lo tanto, sus axiomas no son suficientes para definir la métrica de Minkowski.

Hacer referencia a los componentes del tensor no funcionará, ya que cambian mucho entre diferentes sistemas de coordenadas. Por ejemplo, en coordenadas esféricas, la misma métrica de Minkowski se puede escribir como diagnóstico ( 1 , 1 , r 2 , r 2 pecado 2 θ ) . En su lugar, debemos proporcionar alguna definición que sea invariante de coordenadas, de modo que se mantenga independientemente del sistema de coordenadas particular con el que elijamos trabajar.

Una propiedad que solo cumple la métrica de Minkowski es que es la métrica plana, es decir, el tensor de Riemann asociado a su conexión Levi-Civita desaparece. Esta propiedad, si se suma a las que mencionaste, caracteriza la métrica de Minkowski de manera única.

En resumen, la métrica de Minkowski es la única métrica lorentziana plana. Nótese que esto no es suficiente para caracterizar toda la variedad como espaciotiempo de Minkowski: el espaciotiempo de Minkowski es topológicamente R 4 , pero se puede tener un espacio-tiempo plano con una topología de cuatro toros, por ejemplo (es decir, el espacio se parece al mundo de Pacman, en el que sales por un extremo y vuelves por el otro, y lo mismo ocurre con el tiempo).

tengo una pregunta En el caso del espacio afín 4D real de la relatividad especial, sabemos que las transformaciones de Lorentz (+ traslaciones) son las transformaciones únicas que dejan invariante el elemento lineal de la variedad. Si mi sistema de coordenadas es siempre esférico (así que comienza y termina esférico), el producto interno de la variedad (es decir, el tensor métrico de Minkowski, que puede dar el elemento de línea) debe escribirse en consecuencia (como se muestra en esta respuesta). Mi pregunta es entonces: ¿cómo sería la transformación de Lorentz para dejar invariante este producto interno (y, en consecuencia, el elemento de línea)?
@TrentKent6 Creo que es lo suficientemente complicado como para merecer una nueva pregunta jajaja. No todas las transformaciones de Lorentz mantendrían ese elemento de línea invariable: si realiza un impulso en alguna dirección, está eligiendo una dirección en la que está impulsando, por lo que el sistema de coordenadas previamente isotrópico tendrá que adaptarse para lidiar con eso. Mi > suposición < es que solo las rotaciones del sistema de coordenadas satisfarían esto, pero no estoy completamente seguro
Estaba pensando en tu respuesta, y hay algo que no está claro en tu definición de minkowski ≡ tensor métrico con (R=0). Considere un espacio-tiempo completamente plano (por lo que R = 0 en todas partes) y un observador no inercial (también conocido como acelerador). GLOBALMENTE (por ejemplo, en un punto ubicado a 1 km de distancia; así que insisto: ¡ no localmente !) este observador verá que el elemento de línea allí no se describe por la métrica de minkowski, sino por una métrica diferente (ya que no es inercial). Y, sin embargo, todavía es R = 0 allí. Si pudieran describir el punto global con minkowski, serían inerciales, contradiciendo el punto de partida...
[...] se sigue que, dado que el tensor métrico utilizado para el punto lejano no es minkowski y dado que tiene R=0, minkowski no puede ser el único tensor métrico con (R=0).
@TrentKent6 El tensor es independiente de las coordenadas y del observador. Un observador acelerado no ve una métrica de Minkowski en el mismo sentido que las coordenadas esféricas no escriben ( , + , + , + ) . El tensor es un objeto geométrico definido sin necesidad de coordenadas ni observadores, solo sus componentes dependen de las coordenadas
Además, observe que dije que el tensor de Riemann se desvanece, R a b C d = 0 . Hay métricas que tienen escalar de Ricci que se desvanece R = gramo a b R a C b C = 0 pero no son la métrica de Minkowski.
Notación descuidada, por "R" me refería al tensor de Riemann, no al escalar de Ricci
Pero entonces, si minkowski ≡ tensor métrico con (tensor de Riemann=0), ¿qué pasa con los marcos inerciales locales? allí, la métrica siempre se puede poner a minkowski, pero el tensor de Riemann no es necesariamente 0 ... la definición no parece mantenerse allí ...
@TrentKent6 Solo teniendo d s 2 = d t 2 + d X 2 + d y 2 + d z 2 en algún sistema de coordenadas no es suficiente decir que esta es la métrica de Minkowski. Todas las métricas se pueden poner de esta forma en un sistema de coordenadas adecuado. Esta forma no es la métrica de Minkowski. Una métrica no es solo la expresión en coordenadas, es un mapa lineal definido en cada punto de la variedad. Si elige un marco inercial local, la métrica asumirá otros valores en otros puntos que no son solo ( + + + ) , porque sigue siendo una función
La métrica es un objeto que no depende de la elección del encuadre. A menudo se expresa en un marco por conveniencia, pero se define sin necesidad de un marco específico. Lo que realmente destaca a la métrica de Minkowski es que es plana, y esta es una afirmación que no depende de coordenadas. Elegir un marco inercial local es elegir un sistema de coordenadas, elegir que la métrica sea plana no lo es. La métrica de Minkowski es plana, todas las demás métricas también se pueden escribir como ( + + + )
lo sé, el punto es que localmente la métrica siempre se puede poner minkowski, pero sin embargo el tensor de Riemann no tiene que ser 0 allí , porque la métrica podría ser cualquier cosa diferente en los puntos vecinos; por lo tanto, la métrica de minkowski no se puede establecer ≡ en el tensor métrico con (tensor de Riemann = 0)
@TrentKent6, la métrica no se define un punto a la vez para que sea Minkowski. En un solo punto , puede escribir la métrica con los mismos componentes que tiene la métrica de Minkowski en un sistema de coordenadas particular. Eso no significa que la métrica pueda ser Minkowski. Todavía no es la métrica de Minkowski porque la métrica también depende de los puntos vecinos.
Es similar a decir que solo porque la función X 2 desaparece en cero, debe ser la función cero. No puedes simplemente mirar un punto a la vez e ignorar completamente los otros. La métrica cambia de un punto a otro y, en general, solo podrá escribirla en coordenadas inerciales locales un punto a la vez, precisamente porque la métrica no es en general la métrica de Minkowski y, por lo tanto, tiene curvatura.
Tiene razón al decir que siempre se puede elegir un sistema de coordenadas en el que la métrica se escribe como d s 2 = d t 2 + d X 2 + d y 2 + d z 2 en algún punto a pesar de que el tensor de Riemann no es cero. Te equivocas al identificar la expresión d s 2 = d t 2 + d X 2 + d y 2 + d z 2 con la métrica de Minkowski sin las imposiciones adicionales que esta expresión debería tener en toda la variedad, lo que significaría que la curvatura de Riemann desaparece.

Dada una forma bilineal, simétrica y no degenerada sobre el espacio tangente, expresada como gramo m v = gramo ( m , v ) , o de manera equivalente como el tensor gramo = gramo m v d X m d X v (convención de suma utilizada), donde { X m : m = 0 , 1 , . . . , norte } son las coordenadas (al menos, localmente) y m = / X m son los operadores diferenciales parciales que componen el marco tangente, imponen las siguientes condiciones adicionales expresadas en términos de las derivadas de Lie X de ciertos campos vectoriales X :

(1) Homogeneidad: ρ gramo = 0 , para todos ρ = 0 , 1 , . . . , norte ,

(2) N+1-Isotropía: X σ ρ X ρ σ gramo = 0 , para todos ρ , σ = 0 , 1 , . . . , norte (sin pérdida de generalidad, puede tomar ρ σ o incluso ρ < σ ); dónde X 0 = X 0 y X i = X i , para i = 1 , 2 , . . . , norte . Eso le da una isotropía espacial de buena fe con respecto a las dimensiones similares al espacio. 1 , 2 , . . . , norte y no aceleracionosidad (a falta de un término mejor) con respecto a las combinaciones mixtas de la dimensión temporal 0 con cada una de las dimensiones espaciales.

Entonces, la métrica es una métrica de Minkowski (hasta un múltiplo constante distinto de cero), si norte > 1 .

(La métrica de Minkowski η = η ρ σ d X ρ d X σ se cuela en las condiciones como la matriz diagonal constante ( + 1 , 1 , 1 , 1 ) de coeficientes en X ρ = η ρ σ X σ . No hay escapatoria El η .)

Para norte = 3 y 3+1 dimensiones, los 10 vectores de mentira, en notación vectorial 3D son:

t ,
= ( X , y , z ) ,
𝐫 × = ( y z z y , z X X z , X y y X ) ,
t + 𝐫 t = ( t X + X t , t y + y t , t z + z t ) ,
dónde t = X 0 y 𝐫 = ( X , y , z ) = ( X 1 , X 2 , X 3 ) . Los cuatro conjuntos de vectores de mentira son, respectivamente, para estacionariedad , homogeneidad espacial , isotropía espacial y no aceleración . La métrica debe ser estacionaria, espacialmente homogénea, isótropa y no acelerada (a falta de un término mejor).

Primero, hacemos (1). Desde

ρ d X m = ρ ˩ d d X m + d ( ρ ˩ d X m ) = m ˩ 0 + d ( d ρ m ) = 0 ,
y ρ gramo m v = ρ gramo m v , luego usando la regla del producto para ρ , tenemos:
0 = ρ gramo m v d X m d X v = ( ρ gramo m v ) d X m d X v + gramo m v ( 0 ) d X v + d X m ( 0 ) = ρ gramo m v d X m d X v ,
de lo que se deduce que ρ gramo m v = 0 o que los componentes gramo m v son todos constantes.

En segundo lugar, hacemos (2). En general

X d X m = X ˩ d d X m + d ( X ˩ d X m ) = m ˩ 0 + d X m = d X m ,
entonces para X = X σ ρ X ρ σ , tenemos X m = X σ d ρ m X ρ d σ m y por lo tanto:
X σ ρ X ρ σ d X m = d ( X σ d ρ m X ρ d σ m ) = d ρ m d X σ d σ m d X ρ .
Además, dado que los componentes gramo m v son constantes, entonces tenemos X gramo m v = X ρ ρ gramo m v = 0 , independientemente de lo que X es. Así, usando la regla del producto, nuevamente, tenemos:
0 = X σ ρ X ρ σ gramo = ( 0 ) d X m d X v + gramo m v ( d ρ m d X σ d σ m d X ρ ) d X v + gramo m v d X m ( d ρ v d X σ d σ v d X ρ ) ,
o
0 = gramo ρ v d X σ d X v gramo σ v d X ρ d X v + gramo m ρ d X m d X σ gramo m σ d X m d X ρ ,
o, por componentes, usando la simetría de η y (supuesta) simetría de gramo para intercambiar índices:
0 = gramo v ρ η m σ gramo v σ η m ρ + gramo m ρ η v σ gramo m σ η v ρ .

Esta condición es trivial si ρ = σ o m = v ; particularmente, si norte = 0 . Si norte = 1 , entonces sin pérdida de generalidad, podríamos tomar ( ρ , σ ) = ( 0 , 1 ) = ( m , v ) y escribe

0 = gramo 10 ( 0 ) gramo 11 ( 1 ) + gramo 00 ( + 1 ) gramo 01 ( 0 ) = gramo 00 + gramo 11 .
Eso es lo mejor que puedes hacer. La métrica forma una constante simétrica sin trazas. 2 × 2 matriz.

Si norte > 1 , elige cualquiera m , ρ m y σ = v m , ρ . Entonces nosotros tenemos:

0 = gramo v ρ ( 0 ) gramo v σ ( 0 ) + gramo m ρ η v σ gramo m σ ( 0 ) = ± gramo m ρ .
De este modo, gramo m ρ 0 para ρ m y gramo forma una matriz diagonal. A continuación, elija cualquiera ρ = m y σ = v m , ρ . Entonces nosotros tenemos:
0 = gramo v ρ ( 0 ) gramo v σ η m ρ + gramo m ρ η v σ gramo m σ ( 0 ) = gramo v σ η m ρ + gramo m ρ η v σ .
De esto se sigue que gramo m ρ / η m pag = gramo v σ / η v σ . Por lo tanto, gramo es un múltiplo constante de la métrica de Minkowski η . Desde gramo se supone que no es degenerado, el múltiplo constante debe ser distinto de cero. De lo contrario, si es degenerado, el múltiplo constante es 0, y luego gramo debe ser 0 y totalmente degenerado.

1) ¿tienes fuentes? REALMENTE me gustaría leer más sobre esta respuesta exacta.
2) ¿Estos axiomas también funcionan para el "tensor métrico de minkowski" que aparece SOLO LOCALMENTE en cualquier geometría de relatividad general posible?
Esa es en realidad la forma estándar de obtener soluciones que poseen una gama de simetrías. Comience con una métrica general, exija que desaparezca su corchete de mentira con las simetrías relevantes. Eso define las isometrías de la métrica y los campos vectoriales se denominan Killing Fields . Para la solución del agujero negro (o de Schwarzschild), por ejemplo, usted impone solo la isotropía y las condiciones estacionarias, no la homogeneidad espacial (ya que tiene un centro) ni la falta de aceleración (ya que el centro es fijo). La construcción no es local; en particular, las simetrías de homogeneidad (es decir, "traducción") no lo son.

Sí, eso es suficiente.

Sin embargo, para ser pedante, una métrica siempre tiene una firma definida positiva, también conocida como (+,+,+, ..,+), mientras que una semimétrica puede tener una firma arbitraria. Una variedad con una métrica se llama variedad Riemanniana, mientras que una variedad con una semimétrica se llama variedad semi-Riemanniana. A menudo se usa el calificador 'pseudo' en lugar de 'semi', pero prefiero no usarlo ya que la interpretación convencional de pseudo significa falso o falso. Una variedad lorentziana es una variedad semi-riemanniana con firma (-++++...+) o (+----...-) y esto es lo que busca. El espacio de Minkowski es simplemente una variedad lorentziana plana 4d.

Hola, ¿a qué parte de mi pregunta se refiere tu respuesta "sí"? ¿Es la "pregunta" o la "subpregunta parte b" (donde introduzco los coeficientes -1,1,1,1)?
@TrentKent6: A la pregunta principal.
pero el tensor métrico de Schwarzschild también satisface esos 2 axiomas, y sin embargo no es el tensor métrico de Minkowski...
@TrentKent6: Ah, está bien. Veo a lo que te diriges. Diría que el axioma adicional que necesita es que el espacio es plano, es decir, la curvatura de Riemann desaparece.
pero en el espacio-tiempo curvo, localmente (en cualquier punto) todavía tienes el tensor métrico de minkowski y, sin embargo, en ese punto no se requiere que la curvatura de Riemann desaparezca...
@TrentKent6: Claro, esa métrica de Minkowski está en el plano tangente de la variedad en ese punto. Requerimos esto por definición del campo de tensor métrico: es un campo de métricas. Cuando la curvatura desaparece, entonces tienes transporte paralelo y puedes transportar la estructura de Minkowski de manera paralela a través de todo el colector y esto significa que es isomorfo a un espacio de Minkowski.
@TrentKent6: ... en realidad, no es así. Todavía hay algunos problemas adicionales con mi caracterización. Por ejemplo, la curvatura del cilindro ordinario y un plano también se desvanecen pero no son isomorfas globalmente, solo localmente. Parece que también necesitará algunas restricciones topológicas, por ejemplo, decir que el espacio es contráctil, lo que equivale a decir que su grupo fundamental debería desaparecer (es decir, ser trivial).
el punto es que Riemann=0 no puede ser el axioma adicional para definir η de manera única, porque hay instancias donde η está presente, pero Riemann≠0, como localmente en cualquier punto de un espacio-tiempo curvo
@TrentKent6: Claro, estuve de acuerdo arriba. Necesita restricciones topológicas globales como que el espacio es contraíble.