Índices escalonados (ΛμνΛμν\Lambda^\mu{}_\nu vs. ΛμνΛμν\Lambda_\mu{}^\nu) en transformaciones de Lorentz

Tengo algunas preguntas abiertas sobre el uso de índices escalonados al escribir las transformaciones de Lorentz y sus inversas y transpuestas.

¿Cuáles son los significados respectivos de Λ m v en comparación con Λ m v ? ¿Cómo se usa esta notación de índice escalonado para denotar transpuesta o inversa?

Si quiero tomar cualquiera de estos objetos y escribirlos explícitamente como matrices, ¿existe una regla para saber qué fila de etiquetas de índice y qué columna de etiquetas para un elemento de matriz? ¿Es la regla: "(índice izquierdo, índice derecho) = (fila, columna)" o es "(índice superior, índice inferior) = (fila, columna)" o hay una regla diferente para Λ m v en comparación con Λ m v ?

¿Existen diferentes convenciones para cualquiera de estas utilizadas por diferentes autores?

Como un ejemplo concreto de mi confusión, permítanme intentar mostrar que dos definiciones de una transformación de Lorentz son equivalentes.

Definición-1 (libro QFT típico): Λ m α Λ v β η α β = η m v

Definición-2 ( Λ la matriz debe conservar el pseudo producto interno dado por η matriz): ( Λ X ) T η ( Λ y ) = X T η y , para todos X , y R 4 . Esto implica, en términos de componentes de la matriz (y ahora cambiaré a la notación de álgebra lineal, lejos de la notación de tensor físico): j , k ( Λ T ) i j η j k Λ k yo = η i yo . Esta última ecuación es mi "Definición-2" de una transformación de Lorentz, Λ , y no puedo hacer que se vea como "Definición-1", es decir, no puedo manipular la ligera diferencia en el orden de los índices.

La transformación de Lorentz no es un tensor, no se transforma como tensor, es simplemente un mapeo lineal.

Respuestas (3)

Por convención, los vectores se escriben como vectores de columna, mientras que los vectores duales se escriben como vectores de fila. Esto significa que, en principio, los índices superiores deberían indexar columnas y los índices inferiores deberían indexar filas. Sin embargo, en la práctica, normalmente traducimos tensores de rango 2 a matrices por orden de los índices, el primero indexa filas, el segundo indexa columnas.

La única forma que se me ocurre para hacer que esta traducción de tensores a matrices esté estructuralmente bien definida (lo que nunca he visto en la literatura), es forzar a todos los tensores de rango 2 a la forma m v , que se puede lograr mediante la contracción con 'tensores de Kronecker' apropiados, por lo que me refiero a tensores de rango 2 cuyos componentes son 1 si los índices concuerdan y 0 en caso contrario.

Llamemos a estos tensores d ¯ m v y d _ m v .

Entonces, el producto de matrices dado en tu pregunta

X T η y
se traduciría a
( X m d _ m v ) ( d ¯ v α η α β ) ( y β )
El primer término tiene un único índice inferior libre (también conocido como vector de fila), el segundo término tiene un índice superior e inferior libres (también conocido como matriz) y el tercero un índice superior libre (también conocido como vector de columna).

Como todos los tensores de Kronecker se pueden eliminar mediante el ajuste del índice, esto es equivalente a la expresión mucho más simple

X m η m β y β

Como puede ver, si bien no hay un símbolo especial para la transposición en la notación de índice, normalmente está implícito por qué índice se suma, podría hacerse explícito usando los 'tensores de Kronecker', pero todo lo que ganaría es agregar innecesariamente complejidad.

Ahora, después de esta ronda de reflexiones inútiles, volvamos a algo que realmente es importante al leer literatura:

Los índices bajan y suben por contracción con el tensor métrico y su inverso. Entonces, por ejemplo, dado un tensor A m v , entonces

A m v A α β η α m ( η 1 ) β v

Para el tensor métrico en sí, tenemos

( η 1 ) m v = η m v
probado aquí y para las transformaciones de Lorentz
( Λ 1 ) τ m = Λ m τ
probado aquí .

Esta es una propiedad especial de estos tensores específicos y no se cumple para los arbitrarios.

Gracias - gran respuesta! Además, para un tensor de rango 2 totalmente reducido o totalmente elevado, ¿cómo identificamos los elementos de la matriz? ¿Es siempre (izquierda, derecha) = (fila, columna)?
@Nahsik: Creo que sí; si ambos índices son del mismo tipo, no hay un mapeo intrínseco de filas y columnas, por lo que seguimos la convención para los índices de matriz; esa también es mi conjetura por qué normalmente escribimos mapas lineales como A m v en lugar de la opción igualmente válida A v m - solo con el primero, el orden de los índices es fila , columna
No estoy seguro de si el comentario de su respuesta original sobre filas/columnas es correcto. Usted dice que el índice superior etiqueta la columna. @joshphysics dice que el índice más a la izquierda etiqueta la fila. Es decir, usted dice que la distinción superior/inferior es lo que importa para identificar un elemento de matriz, pero él dice que la distinción izquierda/derecha es lo que importa. Dice eso en esta respuesta: physics.stackexchange.com/a/118580/116779
Para aclarar, según la interpretación de la notación de Joshphysics, sería prudente evitar el uso de la notación de Λ m τ , ya que es lo mismo que ( Λ 1 ) τ m , que revela que el verdadero índice más a la izquierda es en realidad τ .
Y para explicar por qué me inclino a pensar que Joshphysics tiene razón al decir que el extremo izquierdo indica la fila, considere el producto B m v v v . Aquí, v v es un vector (es decir, un vector de columna), por lo que su índice etiqueta filas (es decir, componentes de un vector de columna). El índice de matriz contratado con este índice debe ser, por supuesto, el índice de columna de la matriz. Entonces v (el índice más a la derecha) etiqueta las columnas de la matriz, y m es entonces el índice más a la izquierda que etiqueta las filas, de acuerdo con Joshphysics.
@Nahsik: ver editar

Incorrecto. ( Λ T ) m τ = Λ τ m La fuente que usó no tuvo en cuenta el hecho de que la notación de índice no distingue las matrices de sus transpuestas, de ahí el error. El inverso correcto es: ( Λ 1 ) m τ = Λ τ m Esta notación se puede encontrar en Schutz, por ejemplo, y es consistente con los tensores de Kronecker, así como con la convención primada/no primada. Estas reglas se aplican solo a las matrices LT: una matriz arbitraria (no LT) aún usaría la regla de transposición estándar.

Creo que es porque usa Λ T η Λ = η para obtener la notación de índice dada... Vi este tipo de cálculo en algún artículo, pero olvidé de qué se trata.

La forma en que lo pienso es tratando de contratar siempre el índice más cercano. Entonces ω m se transforma como

ω m ω m = Λ m m v ω v ,
y v m se transforma como
v m v m = Λ m v m v v .
La regla para subir/bajar debe dejar intacto el orden de los índices (es decir, moverlos solo verticalmente), por lo que
gramo m σ gramo v λ Λ σ σ λ = Λ m v m , gramo m σ gramo v λ Λ σ λ σ = Λ m m v .
Déjame denotar gramo la matriz ( gramo m v ) m r o w v C o yo , por Λ la matriz ( Λ m v m ) m r o w v C o yo y por Λ ~ la matriz ( Λ m m v ) m r o w v C o yo . Tenga en cuenta que, debido a gramo m v gramo v ρ = d m ρ m , uno también tiene gramo 1 = ( gramo m v ) m r o w v C o yo .

Las ecuaciones anteriores se leen en esta notación

gramo Λ ~ ( gramo T ) 1 = Λ , gramo 1 Λ gramo T = Λ ~ .
Haciendo manipulaciones obvias y usando gramo = gramo T obtenemos, por ejemplo
Λ 1 gramo Λ ~ = gramo .
A priori Λ y Λ ~ son matrices independientes, pero la ecuación anterior, a la luz de la definición de las transformaciones de Lorentz, sugiere definir
(1) Λ 1 = Λ ~ T .
Los productos escalares también funcionan. En efecto
ω v ω m v m ω m v m = ω v Λ m m v Λ m ρ m v ρ = ω Λ ~ T Λ v = ω v .
Y claramente lo mismo se puede mostrar manipulando los índices solo
Λ m m v Λ m ρ m = gramo m σ gramo ρ λ Λ m m v Λ λ σ λ = gramo ρ λ gramo v λ = d ρ ρ v .
En mi opinión, el enfoque más claro para explicarlos sería decir que la matriz arriba-abajo y la matriz abajo-arriba son matrices independientes a priori, y luego introducir la restricción ( 1 ) .

En su cuarta ecuación mostrada (en realidad es un par de ecuaciones), creo que el superíndice "T" está en la g incorrecta en cada ecuación de ese par. Además, en su delta de Kroncker final, creo que estamos moralmente obligados a respetar completamente la ubicación del índice (al menos en la presente discusión), por lo tanto, el rho y el nu deben estar escalonados, con el rho primero.
Gracias por el comentario. Creo que la colocación de T era correcto, pero para ser justos, no definí la matriz asociada a gramo con índices más bajos. Creo que ahora está más claro. También cambié los índices en el d aunque en mi opinión sería mejor dejarlos como estaban, enfatizar d ρ m = d ρ m .
Pequeña corrección: la mayoría de las veces te identificas correctamente Λ como matriz, pero en un momento lo llamas tensor, cuando claramente no lo es.