¿Qué significa contraer los índices de una matriz de Lorentz?

El tensor métrico en SR obedece a la ley de transformación (estoy usando la notación de barra de Schutz para diferentes índices de marco):

η α ¯ β ¯ = Λ   α ¯ m   Λ   β ¯ v   η   m v

Si no me equivoco, la segunda matriz de Lorentz se puede contraer con la métrica así:

η α ¯ β ¯ = Λ   α ¯ m   Λ   m β ¯

Esto parece incorrecto ya que los elementos de la matriz de Lorentz generalmente se escriben con un índice superior y uno inferior, y no entiendo cómo Λ m β ¯ podría escribirse en una representación matricial.

De varias fuentes, también me dicen que las ecuaciones anteriores son equivalentes a la multiplicación de matrices con la transpuesta de Λ :

η = Λ η Λ T

  • ¿Contraer la matriz de Lorentz la transpone?

  • ¿Cuáles son las diferencias entre Λ   v ¯ m , Λ   v m ¯ , Λ m v ¯ y Λ m v ¯ ? ¿Cuáles de ellos son inversos y cuáles transpuestos?

¿Preferiría una visión matemática de lo que está pasando o un enfoque más pragmático de cómo funcionan los cálculos en las notaciones de índice?
@KilianM Entiendo cómo aplicar la Convención de suma de Einstein para obtener las respuestas a través del cálculo. Estoy más confundido acerca de la intuición y sí, la perspicacia, detrás de lo que está sucediendo, como los efectos de la reducción/aumento del índice en la representación de la matriz.

Respuestas (3)

Tenga en cuenta que Λ no es en sí mismo un tensor. Es una matriz de coeficientes de transformación.

Un tensor está bien definido en ausencia de cualquier marco especificado, y sus componentes pueden definirse en un marco u otro. La transformación de Lorentz, por el contrario, se utiliza para calcular cómo cambian los componentes del tensor de un cuadro a otro.

Contraer un índice hacia arriba y otro hacia abajo en un tensor de segundo rango da un tensor de rango cero, lo que equivale a decir un escalar invariante. Contratando un índice hacia arriba y otro hacia abajo en un no tensor como Λ b a dará algún tipo de resultado matemático, pero no se garantiza que sea una cantidad de interés particular. Del mismo modo, la combinación de métrica con Λ b a se puede usar para obtener una cantidad con todos los índices hacia abajo, pero no es un tensor y es mejor no jugar estos índices de gimnasia sin tensores. Sólo dejalo Λ b a ser lo que es

Para un tensor de segundo rango, bajar el primer índice corresponde a premultiplicar por la métrica en lenguaje matricial; bajar el segundo índice corresponde a posmultiplicar por la métrica. La operación de transposición corresponde a invertir el orden de los índices (NB sin moverlos hacia arriba o hacia abajo). Por ejemplo

Λ m a Λ v b F m v = Λ m a F m v Λ v b = Λ m a F m v ( Λ T ) v b
y en notación matricial esta combinación se puede escribir
Λ F Λ T

Creo que entiendo que no deberías jugar demasiado con la reducción/elevación de los índices en la matriz de Lorentz, pero me preguntaba más acerca de cómo se interpreta el acto de bajar/aumentar como transformaciones de la representación de la matriz, es decir, transponer/invertir la matriz. . ¿Cómo se obtiene el resultado transpuesto del índice reducido? Λ m v ¯ ¿arriba?
@HexiangChang Agregué más información para abordar estos puntos.

Primero una breve introducción a los tensores. Un ( r , s ) tensor t en un k -espacio vectorial V es solo un mapa multilineal de s Copias de V y r copias del espacio vectorial dual V al campo subyacente k :

t : V × . . . × V r t i metro mi s × V × . . . × V s t i metro mi s k
El espacio vectorial dual es solo el conjunto de todos los mapas lineales de V a k . el conjunto de todos ( r , s ) tensores en V se denota comúnmente T s r ( V ) .

Ok, ¿cómo llegamos de estos vectores y mapas lineales a estos números? gramo m v con el que estamos trabajando?

Bueno, hacemos lo que siempre hacemos intuitivamente, a saber, elegir una base. Digamos que elegimos alguna base { mi i } V en nuestro espacio vectorial, ahora podemos expresar cada vector v V como una combinación lineal de estos vectores base: v = v i mi i . El v i k son básicamente números y la posición del índice hasta ahora es solo una convención. Ahora podemos hacer lo mismo para el espacio vectorial dual, con una elección de base particularmente inteligente { mi i } V , tal que mi i ( mi j ) = d j i . Nuevamente, la posición del índice es solo una convención para no mezclar vectores y vectores duales, ¡ya que estos son objetos fundamentalmente diferentes!

Con esta convención de índice, ahora escribiríamos los componentes de un vector como v i y de un vector dual como v i .

Para los tensores, es muy similar:

t ( w k ( 1 ) mi k , . . . , w yo ( r ) mi yo , v ( 1 ) i mi i , . . . , v ( s ) j mi j ) = w k ( 1 ) . . . w yo ( r ) v ( 1 ) i . . . v ( s ) j t ( mi k , . . . , mi yo , mi i , . . . , mi j )
El t ( mi k , . . . , mi yo , mi i , . . . , mi j ) t i . . . j k . . . yo son nuevamente solo números, independientemente de los vectores y covectores sobre los que actúa el tensor (solo la base que elegimos). De manera similar a los vectores y covectores, también podemos expresar el tensor en términos de sus componentes:
t = t i . . . j k . . . yo mi k . . . mi yo mi i . . . mi j

Bien, ahora, ¿qué sucede cuando elegimos una base diferente? { b i } V y una base dual correspondiente { b i } V ? Dado que nuestros nuevos vectores base (y los nuevos covectores base) siguen siendo elementos del mismo espacio vectorial (doble) subyacente, podemos expresarlos como una combinación lineal:

b i = A i j mi j y b i = B j i mi j
Similar a lo anterior, podemos ver los números A i j y B j i como componentes de un tensor:
A = A i j mi j b i y B = B j i b i mi j
nota : en física, normalmente no vemos estas transformaciones como tensores, sin embargo, creo que esto es bastante útil para nuestra discusión aquí. Para obtener más información, consulte, por ejemplo ( ¿Es la transformación de Lorentz un tensor? )

Ahora, por último, ¿qué significa realmente contraer dos tensores? Las contracciones de tensor en realidad solo se definen para un tensor individual y son mapas lineales C yo k : T s r ( V ) T s 1 r 1 ( V ) definido por:

T m 1 . . . m s v 1 . . . v r mi v 1 . . . mi v r mi m 1 . . . mi m s T m 1 . . . m s v 1 . . . v r mi m yo ( mi v k ) mi v 1 . . . mi v yo 1 mi v yo + 1 . . . mi v r mi m 1 . . . mi m k 1 mi m k + 1 . . . mi m s )
Pero eso no es problema, ya que podemos hacer un tensor de dos usando el producto tensorial. En tu caso particular tenemos el "tensor" Λ = Λ m v mi v b m y el tensor η = η m v mi m mi v :
η Λ = η m v Λ β α mi m mi v mi α b β
y
C v α ( η Λ ) = η m v Λ β α mi v ( mi α ) mi m b β = η m v Λ β v mi m b β Λ m β mi m b β
En GR (y SR) el espacio-tiempo es una variedad lorentziana L , el espacio vectorial de interés es el espacio tangente T pag L en algún momento pag L y los tensores que está considerando tienen un significado especial, sin embargo (como siempre) las matemáticas no se preocupan demasiado por la física.

¿Por qué se le permite tratar la matriz de Lorentz como un tensor? ¿Tu resultado cambia cuando no se trata como un tensor? (
Puedes construir un tensor a partir de los componentes Λ v m en la forma en que lo describí, sin embargo, dado que entonces es un producto tensorial de los (co) vectores de base antiguos y nuevos, los componentes no se transforman como esperábamos bajo el cambio de base. Sin embargo, cuando desea hablar con precisión sobre estas ideas matemáticas como la contracción, etc., es muy útil tener una comprensión precisa de lo que estamos haciendo.

Me tomó bastante tiempo llegar al comienzo de la clase de relativismo, pero esto puede ayudar: una multiplicación general de matrices como todos sabemos se ve así:

[ A ] [ B ] = a r i b i r
Ahora, la versión de la relatividad con la convención de suma de Einstein haría que esta multiplicación de matrices se viera así:
[ A ] [ B ] = a v σ b σ v
Como puede ver, esto es lo mismo que la declaración anterior con solo el símbolo de suma eliminado y, por lo tanto, con el primer índice que representa la fila y el segundo que representa la columna. Ahora, posiblemente haya personas que tengan una explicación de cómo un tensor (2,0) (es decir, 'covariante') es diferente de un tensor (0,2) (es decir, 'contravariante'), sin embargo, mantengo la regla en mi cabeza. que solo puede contraer índices covariantes con contravariantes, y así aplicar una métrica de la forma gramo m m ( gramo m m ) si es necesario bajar (subir) los índices. Para llegar a la forma de las matrices, es necesario volver a convertir el tensor en una forma matricial contrayéndolo con una métrica. Usaré la métrica de minkowski η aquí para la demostración. Esto nos lleva de vuelta a su pregunta, su ecuación se puede escribir como:
Λ σ α η m σ Λ v σ η β σ η m v = Λ σ α η β σ Λ v σ d v σ = Λ v α η β σ Λ v σ = v β [ Λ ] [ η ] [ Λ ] T
Donde he usado el hecho de que
η m σ η β σ = d σ m
Y solo el aumento y la disminución básicos de los índices a través de:
Λ α m = Λ σ α η m σ  y  Λ m α = Λ σ α η m σ

Podría haber cometido un error de índice en alguna parte, pero espero que esto brinde una especie de comprensión y espero que ayude.

En realidad, no se trata solo de 'nombrar' porque los objetos con los que está trabajando no son matrices, sino tensores. Para los cálculos, es más conveniente trabajar solo con los componentes de estos tensores en una base dada y los índices inferior y superior tienen un significado preciso.
Lo edité, ¿es más correcto ahora?
No use dos pares de índices idénticos en una expresión