¿Por qué definir los cuatro vectores como cantidades que se transforman solo como se transforma el vector de posición?

Un cuatro vector se define como una cantidad de cuatro componentes A v que se transforma bajo una transformación de Lorentz como A m = L v m A v , dónde L v m es la matriz de transformación de Lorentz, que incluye impulsos, rotaciones y composiciones. (En otras palabras, como las componentes de un vector de posición ( X 0 , X 1 , X 2 , X 3 ) se transformaría).

Se afirma que la propiedad útil de los cuatro vectores es que si dos expresiones de cuatro vectores son iguales en un marco, entonces serán iguales en todos los marcos:

A m = B m A m = B m

y por lo tanto podemos expresar las leyes de la física en términos de cuatro vectores, porque permanecen invariantes en todos los marcos.

Pero esta propiedad será cierta incluso para cantidades de cuatro componentes que se transforman (a través de marcos de referencia) como A m = T v m A v , dónde T es cualquier matriz de transformación (no necesariamente una de Lorentz). Mientras podamos encontrar un T que describirá cómo se transforman los componentes de la cantidad, podemos aplicar esa T a ambos lados de una igualdad.

Entonces, ¿por qué requerir (es decir, definir) cuatro vectores para que sean solo cantidades que se transforman bajo una matriz de Lorentz?

Respuestas (6)

En última instancia, hace un punto totalmente legítimo; bien podríamos haber definido el término "cuatro-vectores" para referirnos a un tipo de objeto que se transforma de manera diferente, pero hacemos la definición particular que hacemos porque es útil tener un término que se refiera a cosas que se transforman como posiciones de espacio-tiempo cuando cambias de cuadro. Aquí hay dos razones por las cuales:

Hecho 1. Dados dos cuatro vectores A m y B v , la cantidad gramo m v A m B v es invariante bajo un cambio de marco.

Tenga en cuenta que esto no habría sido cierto a menos que A m y B v eran cuatro vectores porque la prueba de este hecho se basa en que la métrica es preservada por las transformaciones de Lorentz, y no por otras cosas arbitrarias. Aquí hay otra razón por la cual la definición es útil

Hecho 2. Muchas cantidades realmente útiles y físicamente significativas resultan ser cuatro vectores. Toma por ejemplo, j m y A m (la corriente y el vector potencial) en electromagnetismo.

Habiendo dicho todo esto, sin embargo, tenga en cuenta que hay toneladas de otras cantidades que no se transforman como cuatro vectores cuando uno cambia de marco. De hecho, dada cualquier representación ρ del grupo de Lorentz, a menudo se encuentran cantidades q que se transforma como

q = ρ ( Λ ) q
Por ejemplo, hay objetos llamados espinores de Weyl que se transforman como
ψ = ρ w mi y yo ( Λ ) ψ
cuando uno se transforma entre fotogramas.

El resultado de todo esto es el siguiente

Resultado. Los 4 vectores de Lorentz no son especiales. Sin embargo, dado que cada cambio de marco de referencia se puede asociar con una transformación de Lorentz, cada cantidad que se quiera transformar entre marcos debe necesariamente transformarse de una manera que dependa, de una forma u otra, de la transformación de Lorentz entre los marcos. Esto nos lleva no solo a definir cuatro vectores, sino también a una multitud de otros objetos que tienen leyes de transformación específicas bajo cambios de marco y darles nombres especiales. Hacer esto es útil porque tales objetos aparecen por todos lados en física, y podemos probar propiedades útiles sobre objetos con ciertos comportamientos de transformación.

Correcto, ya veo... Es solo que en algunos libros de texto vi declaraciones como "Si una declaración tiene alguna posibilidad de ser verdadera en todos los marcos, debe involucrar solo 4 vectores". [Introducción a la mecánica clásica de Morin, página 644]. Eso es lo que encontré confuso.
@Tim Sí. Esa afirmación no es cierta en general. La covarianza de Lorentz se puede lograr a través de objetos con todo tipo de propiedades de transformación de Lorentz. Tomemos, por ejemplo, la Ecuación de Dirac que está escrita en términos de espinores en.wikipedia.org/wiki/… .
En q = ρ ( Λ ) q , debe la función ρ ser un invariante de Lorentz si existe una ley física que involucre estas cantidades?
@Physicslover No estoy muy seguro de lo que quieres decir en este contexto. ¿Podría explicar qué significa que una representación del grupo de Lorentz sea invariante de Lorentz?
Cada fotograma utiliza la misma transformación de Lorentz cuando transforma eventos con las mismas coordenadas de espacio-tiempo de laboratorio en otros fotogramas con la misma velocidad relativa v . Es una transformación que no cambia al pasar a otro fotograma, lo que la convierte en una especie de "invariante de Lorentz". ¿Quizás esto no es apropiado entonces?

La razón por la que hace esta pregunta es porque definir un vector o un tensor más general como "una cantidad que se transforma de cierta manera" no es muy esclarecedor conceptualmente, pero a menudo se hace para evitar introducir algunas matemáticas ligeramente formales. Aquí hay una mejor manera de proceder:

Dejar METRO sea ​​una variedad (solo piense en el espacio de Minkowski como un ejemplo simple). Definimos un vector v en un punto pag METRO ser un mapa lineal que toma una función F C ( METRO ) (todas las funciones suaves de valor real en METRO ) a un número real C R , que también obedece la regla de Leibniz:

v ( F gramo ) = F ( pag ) v ( gramo ) + gramo ( pag ) v ( F ) .

Ahora para cada punto pag METRO , este conjunto forma un espacio vectorial, llamado espacio tangente T pag METRO . Un " norte -vector" entonces (donde norte es la dimensión de nuestra variedad), es simplemente un campo vectorial suave, es decir, para cada punto pag METRO , nos da un vector que vive en T pag METRO . Resulta que el conjunto de operadores de derivadas parciales { m } para cualquier sistema de coordenadas válido { X m } , forma una base para nuestro espacio tangente, de modo que cualquier cuadrivector se puede escribir como

v = v m m ,
dónde v m son funciones de valor real. Sin embargo, en otro sistema de coordenadas también podemos escribir esto como
v = v m m .
Por supuesto, estos dos vectores son iguales:
v m m = v m m .

De esto vemos que las nuevas coordenadas en términos de las antiguas están dadas por

v m = X m X m v m .

Entonces, en general, para cualquier vector (campo), bajo un cambio de coordenadas, el cambio de componentes viene dado por la matriz de derivadas parciales. Para el caso especial de cambio de coordenadas por transformaciones de Lorentz, la matriz de parciales son las correspondientes matrices de los aumentos de Lorentz (no muy diferentes, ya que las transformaciones de Lorentz son lineales).

Así, al hacer esta definición ves que tu T solo se permite que sea la matriz de derivadas parciales, que en su caso particular, resulta ser L m m , y no cualquier otra transformación arbitraria.

dayareishq ha capturado la idea básica tal como se representa típicamente en la geometría diferencial (y la relatividad general, como una aplicación de esa disciplina). Pero estaría en lo cierto si pensara "¿los vectores son derivadas parciales? ¡Eso no tiene sentido!" Porque no lo hace. Sin embargo, esta identificación es omnipresente en la geometría diferencial; es algo a lo que tienes que acostumbrarte... o encontrar una alternativa buena y sólida (que existe).

La ley de transformación para vectores se deriva de dibujar curvas en el espacio-tiempo. Dada una curva C ( λ ) , transformando esto bajo una transformación arbitraria, suave y diferenciable F ( X ) = X rendimientos C ( λ ) = ( F C ) ( λ ) . Entonces encuentras que d C / d λ = F _ ( d C / d λ ) , dónde F _ es el jacobiano. Esta es una aplicación básica de la regla de la cadena, y ese es todo el contenido matemático de la ecuación de dayareishq v m = v m X m / X m . Los impulsos y rotaciones de Lorentz simplemente obedecen a la simple idea de que, como operadores lineales, son iguales a sus propios jacobianos.

De acuerdo, esto es quizás más fácil de digerir para un nuevo usuario. Debo admitir que yo mismo no entiendo muy bien la idea de que "los vectores son derivadas parciales". Mi conjetura es que definir las cosas de esa manera hace que la ley de transformación jacobiana caiga de forma bastante natural, mientras mantiene las definiciones muy "matemáticas" (definiendo todo para que sean mapas).
He visto que sugirió que alguien tomó la idea de Cartan de que un vector tangente mi α = X / X α y se dio cuenta de que la cantidad no estaba bien definida porque X describe un punto, pero si solo tomaste la derivada parcial, podrías hacer que funcione. La alternativa de la que hablé toma el rumbo opuesto: dejar X sea ​​un vector en algún espacio vectorial de dimensión infinita (aunque el conjunto de puntos que definen una variedad generalmente no formará un espacio vectorial), y luego la operación derivada está bien definida.

Solo las transformaciones de Lorentz corresponden a la transformación geométrica que está asociada con las rotaciones físicas y el cambio de velocidad, y conectan los marcos en los que calcula los tiempos y longitudes adecuados como d t 2 d X 2 . Los componentes métricos involucrados en la computación X 2 = X m X m = η m v X m X v son meros factores ± 1 si X son las coordenadas en un marco inercial, o cualquier marco que se obtiene a partir de ese marco a través de una transformación de Lorentz (que nuevamente llamamos marco inercial).

No requerimos que solo los transformes de cierta manera en general, puedes hacer cualquier transformación que quieras. Si tu gato camina a tu lado con cierta velocidad y quieres ver cómo se ve el mundo desde su punto de vista, debes hacer una transformación de impulso de tus coordenadas. Y Lorentz pensó que las transformaciones de Lorentz hacen eso con más precisión que el impulso de Galileo. Eso no significa que no puedas hacer una transformación galileana para describir el mundo desde otra perspectiva en la que el valor continuo de la coordenada de tiempo no coincida con la percepción del tiempo actual de tu gato (el error no será grande).

Si sabes cómo cambia la posición y haces una transformación de una ecuación que la involucra, entonces la ley de transformación de otras cantidades geométricas, como velocidades, co-vectores que comen velocidades, o cualquier forma en el espacio cotangente (como el tensor de fuerza de campo electromagnético ) son inducidas por el requisito de consistencia y la pretensión de que debería mantenerse un principio de relatividad.

Como se observa a continuación, una fórmula general para transformaciones vectoriales, bajo transformaciones de coordenadas, es A m = X m X m A m .

Y funciona perfectamente bien en el caso especial de las transformaciones de Lorentz.

Pero las leyes de la física no solo se pueden expresar en términos de vectores, también se pueden usar tensores, espinores, etc.

El punto es que debes igualar 2 cantidades que se transformen de la misma manera, bajo transformaciones de coordenadas.

Estoy leyendo a Schutz sobre el tema de los vectores, y creo que dice eso; dada una variedad con dos conjuntos de sistemas de coordenadas que están relacionados a través de una transformación lineal; un par de conjuntos de números (con la misma dimensión que la variedad) es un vector si un conjunto de números está relacionado con el otro conjunto de números a través de la transformación lineal.