¿Cómo derivar el intervalo de espacio-tiempo de la transformación de Lorentz?

He visto muchas derivaciones de la transformación de Lorentz del intervalo de espacio-tiempo.

¿Se puede invertir este proceso para derivar el intervalo de espacio-tiempo de la transformación de Lorentz y los dos postulados de que se aplica el principio de relatividad y la velocidad de la luz es absoluta?

¿Qué está suponiendo precisamente sobre las "transformaciones de Lorentz" de las que desea derivar el intervalo de espacio-tiempo? Que el intervalo sea invariable bajo la transformación de Lorentz es un cálculo sencillo, ¿qué es exactamente lo que quiere derivar?
@ACuriousMind Si aplicamos la transformación de Lorentz al intervalo de espacio-tiempo, podemos ver que es invariable, pero ¿y si no supiéramos la forma del intervalo de espacio-tiempo para poder probarlo? ¿Cómo podríamos hacer que la transformación de Lorentz "escupe a cabo" la invariancia del intervalo de espacio-tiempo?

Respuestas (2)

No sé qué derivación de la forma intervalo de espacio-tiempo invariante Tiene en mente la transformación de Lorentz, pero todas las derivaciones más fáciles hacen inferencias que son inferencias "si y solo si", es decir , la cadena de razonamiento e inferencia se puede ejecutar en ambas direcciones .

Por ejemplo, escribir la transformación de Lorentz como un general 4 × 4 matriz de elementos reales Λ actuando 4 × 1 columnas de elementos reales que representan 4 vectores X R 1 + 3 , entonces la afirmación de la invariancia del intervalo de espacio-tiempo es:

(1) X T Λ T η Λ X = X T η X ; X R 1 + 3

donde, naturalmente, η = d i a gramo ( 1 , 1 , 1 , 1 ) . Ahora elige dos en general diferentes X , Y R 1 + 3 y escribe (1) para la suma X + Y : eso es ( X + Y ) T Λ T η Λ ( X + Y ) = ( X + Y ) T η ( X + Y ) , expanda esta pequeña bestia y luego aplique (1) nuevamente para mostrar que (1) implica:

(2) X T Λ T η Λ Y = X T η Y ; X , Y R 1 + 3

Ahora elija las dieciséis combinaciones diferentes de los vectores base usuales para X y Y y así lo muestras (siendo testigo de que η es no singular, es decir , define una forma bilineal no degenerada):

(3) Λ T η Λ = η

(3) implica trivialmente (1), por lo que (3) y la afirmación del intervalo de espacio-tiempo son lógicamente equivalentes. Se implican y se implican mutuamente.

Ahora yo, y creo que mucha gente, pensaría en (3) como la definición de la transformación de Lorentz: su uso en una notación de construcción de conjuntos nos da una caracterización completa del grupo de Lorentz. Pero es posible que desee trabajar con otras caracterizaciones del grupo de Lorentz, o quizás con el grupo especial de Lorentz (propias, ortocrónicas). Puede verificar trivialmente que un impulso en el X dirección cumple (3), por lo tanto, por nuestra equivalencia lógica, deja invariante el intervalo de espacio-tiempo. Del mismo modo, haz lo mismo para una rotación. R , para lo cual (3) es equivalente a R T R = i d . Por lo tanto, si define el grupo de Lorentz ortocrónico propio como el grupo más pequeño que contiene el X impulso y las rotaciones, es decir, como el grupo de todos los productos finitos de la forma tu 1 R 1 tu 2 R 2 donde el tu i y R i son todos X -impulsos y rotaciones, respectivamente y aplicando (3) a tal cadena inductivamente, puede mostrar que este grupo conserva el intervalo de espacio-tiempo. Tenga en cuenta que, por supuesto, un impulso en cualquier dirección se puede escribir en la forma R tu R T , dónde tu es un X -impulsar y R una rotación

Pfft, "naturalmente" η = d i a gramo ( 1 , 1 , 1 , 1 ) porque algunos de nosotros somos personas "positivas" :D.

Ok, lo tomamos dado que sabemos que las transformaciones entre los marcos que podemos atravesar son la transformación de Lorentz. La definición más concisa y con más contenido de las transformaciones de Lorentz sería la siguiente:

Λ T η Λ = η
O, en la notación de índice,
Λ m α Λ v β η α β = η m v
Ahora, asegúrese de apreciar que estamos tratando la matriz η (ya sea escrito en forma de matriz simple o en notación de índice) simplemente como una matriz. No pretendemos saber a priori que actúa como métrica. Pero más bien, ahora motivaremos por qué sería prudente usarlo como la métrica y (por lo tanto) definir el intervalo como η m v d X m d X v .

El primer paso es notar que la matriz η (simplemente definida como la matriz diagonal con entradas 1 , 1 , 1 , 1 ) es realmente un tensor bajo las transformaciones de Lorentz. Esto se puede leer directamente de la definición misma de las transformaciones de Lorentz cuando la definición se expresa en la notación de índice como se expresó anteriormente.

Ahora que hemos reconocido que η es realmente un ( 0 , 2 ) tensor, utilizando la definición de un ( 0 , 2 ) tensor, debemos apreciar que es el mismo mapa que lleva un par de vectores a un número real (o, en otras palabras, un escalar, una cantidad invariante de marco). Por lo tanto, la forma más natural de construir una cantidad invariante de marco a partir de un vector de desplazamiento d X sería alimentar este vector en ambas ranuras del tensor η y definir el resultado como el intervalo de espacio-tiempo. Es decir, para definir

I = η ( d X , d X ) = η m v d X m d X v = d t 2 d X 2 d y 2 d z 2
como el intervalo de espacio-tiempo.

Por supuesto, si uno insiste, puede argumentar que todo esto es solo una motivación para definir el intervalo de espacio-tiempo a ser d t 2 d X 2 d y 2 d z 2 y nada más. Y eso es cierto. ¡Porque, después de todo, estamos definiendo algo y no hay palabra de Dios sobre cómo debemos definir algo! Es solo que si vemos una propiedad muy útil en una cosa, le damos algún nombre. Lo mismo es cierto para el intervalo de espacio-tiempo. La observación que d t 2 d X 2 d y 2 d z 2 Su invariante es importante y, por lo tanto, lo llamamos el intervalo de espacio-tiempo. Esa es la línea de fondo. Lo que he tratado de demostrar aquí es cómo uno puede tropezar muy fácilmente con esta observación si ya tiene en mente que ella está buscando alguna cantidad invariable.