Relatividad especial: transformando las ecuaciones de Maxwell

Estoy trabajando con el artículo original de Einstein de 1905* y tengo problemas con la sección sobre la transformación de las ecuaciones de Maxwell del reposo al marco móvil.

El papel procede de la siguiente manera:

Sean válidas las ecuaciones de Maxwell-Hertz para el espacio vacío para el sistema estacionario K, de modo que tengamos

IMAGEN: Ecuaciones de Maxwell sin transformar

donde (X, Y, Z) denota el vector de la fuerza eléctrica y (L, M, N) el de la fuerza magnética.

Si aplicamos a estas ecuaciones la transformación desarrollada en el § 3, al referir los procesos electromagnéticos al sistema de coordenadas allí introducido, moviéndose con la velocidad v, obtenemos las ecuaciones

IMAGEN: Ecuaciones de Maxwell transformadas

No entiendo de dónde viene este segundo conjunto de ecuaciones.

Las únicas derivaciones de esta transformación que he podido encontrar involucran potenciales, cuatro vectores o ambos. Sin embargo, dado que los cuatro vectores no se habían inventado en 1905, y debido a que la declaración de la transformación es tan contundente, parece que Einstein está usando o apelando a un método más simple para encontrar la transformación.

Entonces mi pregunta es: ¿ Cuál es la derivación más simple de las reglas de transformación para las ecuaciones de Maxwell en relatividad especial? ¿Einstein está apelando a un método de Lorentz preexistente aquí, o hay un truco para lograr todo esto rápidamente? ¿O el texto aquí simplemente desmiente el verdadero trabajo involucrado en la derivación?

  • No puedo proporcionar un enlace adecuado al documento debido a restricciones de enlaces, pero está en hxxp://www.fourmilab.ch/etexts/einstein/specrel/www/#SECTION21
Esto seguramente no responderá a su pregunta, pero son las reglas de transformación de las ecuaciones de Maxwell las que motivaron la relatividad especial.
Aunque el libro E&M de Jackson tiende a ser desagradable para algunas personas debido a su complejidad/dificultad, tiene una discusión muy buena y físicamente intuitiva sobre la relatividad. Si todo lo demás falla, Jackson también proporciona muchas buenas referencias sobre el tema (especialmente algunos trabajos históricamente significativos, que son interesantes de leer).

Respuestas (3)

Existe una explicación notablemente simple de cómo los fenómenos electromagnéticos deben transformarse en un marco en movimiento si: (1) la física de ese marco debe permanecer invariable; y (2) la velocidad de la luz c debe permanecer invariable tanto para el observador en reposo como dentro del marco en movimiento. Estos son los dos postulados SR originales de Einstein, por supuesto. (En realidad, se necesita una tercera suposición sobre el escalado dimensional ortogonal a la dirección del movimiento. Lorentz discutió ese tema explícitamente, pero Einstein parece asumirlo como un hecho).

La técnica consiste en utilizar péndulos de luz para definir el tiempo y la duración adecuados en ambos marcos, y luego mostrar geométricamente cómo afecta esto a los fenómenos electromagnéticos. Solo lo he usado yo mismo para resaltar las relaciones energéticas, que es parte del breve artículo posterior de Einstein que condujo a mi = metro C 2 (¡Qué técnica tan deliciosamente extraña usa el papel!). Todas las transformaciones de Maxwell son necesariamente implícitas aquellas transformaciones de energía de péndulos de luz en movimiento. Tienen que serlo, de lo contrario, SR no funcionaría.

Tengo a mano algunos diagramas de péndulo de luz que tenía la intención de usar en discusiones sobre la dilatación del tiempo. Los agregaré a esta respuesta en breve y explicaré al menos brevemente cómo se pueden usar para reinterpretar el electromagnetismo y las ecuaciones de Maxwell. No tengo tiempo para un tratamiento completo (volar mañana), pero la perspectiva del péndulo de luz es útil y está profundamente relacionada con las primeras explicaciones de Einstein (y también mucho más tarde) de por qué la relatividad especial es una consecuencia inevitable de mantener c invariante en todos los marcos de movimiento.


Entonces, el Overkill gráfico prometido se produce a continuación. Ni siquiera tengo tiempo esta noche para explicar los gráficos, pero prometo que volveré a ellos.

La incursión inicial en las implicaciones de EM es, por desgracia, la última viñeta de la última diapositiva. Pero muestra cómo las transformaciones tanto de la longitud de onda como de la energía son inherentes e inevitables dentro de las curiosas limitaciones de tener que preservar la física y la velocidad de la luz tanto en el marco que realiza la observación como en el marco que se observa.


Péndulo de luz 3D, fase de salida


Péndulo de luz 3D, fase entrante


Péndulo de luz 2D


Péndulo de luz 1D


Reloj 1D Rho


Un reloj Rho a escala humana


Este gráfico final está en el corazón mismo de cómo Einstein ideó por primera vez la teoría de la relatividad especial. Postuló dos cosas: (1) que la velocidad de la luz permanece invariable en todos los marcos de referencia no acelerados, y (2) que toda la física, incluida no solo la mecánica (relatividad galileana) sino también el electromagnetismo, debe permanecer sin cambios independientemente del marco.

¡Dios mío... lo que hacen esos dos postulados en combinación!

Los péndulos de luz brindan una forma muy sucinta de explorar todas esas implicaciones utilizando un solo dispositivo. Los relojes rho que uso aquí son simplemente péndulos ligeros con suficientes restricciones de diseño y etiquetas específicas de marco adjuntas para permitir que se exploren esas implicaciones.

Entonces, eche un vistazo a esta figura final:

Cuando los péndulos de luz se mueven

Observe que los lados de los rectángulos grises representan caminos de luz dibujados en el espacio-tiempo. Entonces, si la velocidad de la luz es invariable, ¿adivina qué? Un objeto que se está moviendo no puede tener los caminos de luz entrantes y salientes más cortos posibles, porque la luz tiene que seguir constantemente el ritmo del objeto para seguirlo. Si el objeto se mueve muy, muy rápido, el tiempo que tarda la luz saliente en alcanzar su borde de ataque puede ser realmente muy largo, tal como lo ve un observador en el marco de "reposo" etiquetado como 0 ( ϕ 0 ).

¿Cuánto tiempo? Bueno, mira la figura: es solo la altura del cuadro gris escalado, que es lo que el reloj rho ( ρ 1 ) para el cuadro 1 ( ϕ 1 ) se ve como cuando se ve desde el marco de descanso ϕ 0 . Para abreviar, llamo a esa situación ρ 1 :> 0 , donde "1:>0" solo significa que el fotograma 1 está siendo observado por el fotograma 0 (el ":>" son dos ojos mirando hacia la izquierda). Y si, la etiqueta de esa altura es la tradicional γ de la relatividad especial. La idea de γ simplemente emerge mucho más naturalmente (y mucho más geométricamente) en los diagramas rho.

En cuanto a los electromagnéticos, recuerda que ambos marcos deben ver su física sin cambios. Pero observe cómo los pulsos de luz azul en el lado izquierdo del rectángulo gris se juntan para que eso sea cierto. Eso no sucede solo con el espaciado de pulsos, sucede con toda la teoría electromagnética. Entonces, por ejemplo, la luz que viaja a lo largo de la rama izquierda del rectángulo rho del cuadro 1 ("rho" en realidad significa rectángulo, no relatividad) debe aumentar en frecuencia para mantener sin cambios la física interna del reloj rho del cuadro 1 (abreviatura: ρ 1 :> 1 debe permanecer invariable).

Sin embargo, eso tiene enormes implicaciones energéticas en el cuadro 0, ya que cuanto más rápido viaja el objeto, más enérgico se vuelve ese lado del rectángulo del reloj rho. Si combinas eso con algunos argumentos muy inusuales de Einstein en su segundo artículo sobre la relatividad especial (me gusta llamarlo su "argumento de la tautología asintótica"), eventualmente terminas con la famosa ecuación mi = metro C 2 . (Comentario al margen: esa ecuación es más famosa, pero mi 2 = ( pag C ) 2 + ( metro C 2 ) 2 es mucho más útil; pregúntele a cualquier físico de partículas).

Lo bueno de las ecuaciones de Maxwell es que ya acomodaban y permitían formas tan inusuales de escalar mucho antes de que aparecieran Einstein y la relatividad especial. Esa es una de las razones por las que verá elogios casi sin aliento para Maxwell de parte de Einstein y otros físicos involucrados en los primeros días de la relatividad especial. La nueva teoría les ayudó a apreciar de nuevas maneras cuán profundas habían sido las intuiciones de Maxwell.

Me temo que esto no ayuda a responder mi pregunta original.
Obsesivo: Culpable de los cargos, lo máximo que pude obtener con esta caída rápida (lo dejo ahora) fue mostrar el argumento subyacente y el marco que usó Einstein para derivar las transformaciones, además de una idea rápida de cómo funcionan. Vijay, gracias!
@Terry Bollinger Esta cita de Mark Twain parece pertinente aquí: "No tuve tiempo de escribir una carta corta, así que escribí una larga".
D. Halsey, gracias por recordarme esta entrada. Estaba tratando de explicar un punto sobre la relatividad especial la semana pasada, y deseaba tener alguna explicación en línea de mi explicación del reloj rho. Había olvidado por completo publicar mis notas aquí. Ahora tengo el enlace de nuevo -- ¡gracias!

Por casualidad aterricé aquí mientras buscaba documentos históricos...

Bonitos gráficos de Terry Billinger, pero una respuesta simple es mucho más aburrida y solo un trabajo duro. Sin duda, fue el trabajo del amigo de Einstein, Besso, por lo que no queda rastro de su esfuerzo en el artículo publicado, como usted señaló. Sin embargo, esto es pura especulación de mi parte...

Está bien, usaré notaciones más modernas que las de Einstein, pero nada de matemáticas avanzadas...

Dejar X y Y Sean los dos marcos cartesianos en movimiento uniforme uno con respecto al otro. Que comparten O como origen común del espacio-tiempo y sus marcos cartesianos coinciden allí y entonces. Sus relojes atómicos se sincronizan en estado de reposo entre sí antes de alejarse y luego utilizan en sus respectivos cuadros la misma definición para la unidad de longitud: para cada cuadro, el espacio propio atravesado por la luz en el vacío en la unidad de tiempo adecuada; por lo tanto c=1 en ambos marcos. Su movimiento relativo es a lo largo del eje común: O X 1 = O y 1 con velocidad v = bronceado θ , θ es la característica aditiva de la transformación. Con estas notaciones la transformación entre X y Y es

y 0 = X 0 aporrear θ X 1 pecado θ ,
y 1 = X 0 pecado θ + X 1 aporrear θ ,
y 2 = X 2 y y 3 = X 3 .
Si aún prefieres C 1 y el lío de raíces cuadradas, β , γ , etc..., la reconversión a estos horrores es trivial.

Ahora, la conversión de los operadores diferenciales parciales entre estos marcos se obtiene fácilmente a partir de la transformación de coordenadas dada. yo suelo para denotarlos (con el índice apropiado) en el X marco y para aquellos en el Y marco:

0 = 0 aporrear θ 1 pecado θ ,
1 = 0 pecado θ + 1 aporrear θ ,
2 = 2 y y 3 = 3 .

Si reemplaza ciegamente estos operadores diferenciales en las ecuaciones de Maxwell escritas en el X marco

0 H + × mi = 0 ,
0 mi × H = 0 ,
H = mi = 0.
terminas con un verdadero lío de 8 ecuaciones (2 divergencias y 6 componentes para los dos rizos).

Sin embargo, una simple mirada a dos pares de ecuaciones, cada una hecha de una divergencia y su correspondiente componente del rizo en la dirección del movimiento, no deja ningún grado de libertad aparte de una especie de función de escala que Einstein establece en uno por razones de simetría ( reciprocidad de la transformación).

Comencemos con el par correspondiente:

0 mi 1 = 2 H 3 3 H 2 ,
1 mi 1 + 2 mi 2 + 3 mi 3 = 0.

Usando la conversión de derivadas parciales dada arriba, estas dos ecuaciones se convierten en:

aporrear θ 0 mi 1 pecado θ 1 mi 1 = 2 H 3 3 H 2 ,
pecado θ 0 mi 1 + aporrear θ 1 mi 1 = 2 mi 2 3 mi 3 .

eliminando el término 1 mi 1 entre estas dos ecuaciones se obtiene:

0 mi 1 = 2 ( H 3 aporrear θ mi 2 pecado θ ) 3 ( H 2 aporrear θ + mi 2 pecado θ ) ,
que ya resuelve la mitad del problema (módulo algunas posibles funciones de escala) si uno debe terminar con
0 mi 1 = 2 H 3 3 H 2 .

Por lo tanto, despreciando estas posibles escalas:

mi 1 = mi 1 ,
H 2 = H 2 aporrear θ + mi 3 pecado θ ,
H 3 = H 3 aporrear θ mi 2 pecado θ .

El otro par coincidente

0 H 1 = 2 mi 3 + 3 mi 2 ,
1 H 1 + 2 H 2 + 3 H 3 = 0 ,
de manera similar conduce a la otra mitad de la transformación:
H 1 = H 1 ,
mi 2 = mi 2 aporrear θ H 3 pecado θ ,
mi 3 = mi 3 aporrear θ + H 2 pecado θ .

Pero ahora uno bien podría preguntarse si las 4 ecuaciones que quedan atrás (los componentes de los dos rizos transversales al movimiento) van a ser consistentes (los factores de escala difícilmente están en la medida para ayudar). Aquí sucede un milagro y efectivamente después de un álgebra tediosa se completa la demostración peatonal y se deja como ejercicio...

Por supuesto, no hay milagro tan fácil de ver si se utiliza el análisis tensorial o las formas diferenciales o el álgebra de Clifford, etc. para representar el espacio-tiempo de Minkowski y también cuando se da cuenta de que el campo electromagnético no está hecho de pares de "vectores". campos, los campos eléctrico y magnético, como se pensaba en el momento en que Einstein escribió su artículo, pero es un solo campo bi-vector escrito, por ejemplo, como

F = mi 0 ( mi 1 mi 1 + mi 2 mi 2 + mi 3 mi 3 ) + H 1 mi 2 mi 3 + H 2 mi 3 mi 1 + H 3 mi 1 mi 2
en el formalismo de Clifford apropiado.

Mis disculpas por la tediosa longitud de esta respuesta, que es tan elemental que me sorprende que no se haya dado aquí hace mucho tiempo. Mientras tanto, es posible que lo hayas descubierto tú mismo, espero. Mis disculpas también por algunos posibles errores tipográficos y otros errores, con suerte ninguno que el lector no pueda corregir fácilmente, si los hay.

René Grognard

correo electrónico: dositheus@hotmail.com

También he estado revisando (la traducción al inglés de) el artículo original de Einstein de 1905 "Sobre la electrodinámica de los cuerpos en movimiento". En el contexto de su artículo, la derivación es en realidad bastante sencilla. Solo necesita las ecuaciones de Maxwell, la transformación de Lorentz (que Einstein derivó en el segmento anterior del artículo) y la regla de la cadena de derivadas parciales para funciones multivariables compuestas.

En su artículo, Einstein consideró dos marcos de referencia K y k . K es el marco (relativamente) estacionario, mientras que k se mueve con respecto a K a una velocidad v en movimiento lineal uniforme. Las coordenadas en K se expresan como ( X , y , z , t ), y en k como ( ξ , η , ζ , τ ). Por simplicidad, Einstein supuso que en t = 0 , τ = 0 , y los orígenes de K y k superpuesto en t = τ = 0 . Para simplificar aún más las cosas, Einstein supuso que k y K tenía ejes paralelos (y asumió que los ejes estaban en la configuración de la mano derecha), y k se mueve a lo largo del eje X de K.

A partir de estas suposiciones anteriores, Einstein derivó la transformación de Lorentz para convertir las coordenadas ( X , y , z , t ) a ( ξ , η , ζ , τ ):

ξ = β ( X Vermont )
η = y
ζ = z
τ = β ( t vx / C 2 )

dónde

β = 1 / 1 v 2 / C 2

De estas ecuaciones podemos derivar fácilmente la transformación inversa de ( ξ , η , ζ , τ ) a ( X , y , z , t ):

(1) X = β ( ξ + v τ ) (2) y = η (3) z = ζ (4) t = β ( τ + v ξ / C 2 )

En la sección electrodinámica del artículo de Einstein, ahora consideramos un campo electromagnético (clásico) en el espacio vacío:

Dejar mi ( X , y , z , t ) sea la función vectorial que describe el campo eléctrico en el marco K. Asimismo, sea B ( X , y , z , t ) describen el campo magnético en el cuadro K. mi = (X, Y, Z), donde X, Y, Z son funciones escalares que describen el componente vectorial en los ejes x, y, z respectivamente. Similarmente, B = (L, M, N), donde L, M, N son funciones escalares del componente en los ejes x, y, z respectivamente.

Las ecuaciones de Maxwell en el espacio libre son:

mi = ρ ϵ 0
B = 0
× mi = B t
× B = m 0 ( j + ϵ 0 mi t )

Dónde ρ es la densidad de carga eléctrica, j es la densidad de corriente eléctrica, m 0 es la permeabilidad del espacio libre, y ϵ 0 es la permitividad del espacio libre.

Aprovechando que en el espacio vacío, ρ = 0 y j = 0 , y cambiando a unidades guassianas (que es lo que sospecho que hizo Einstein), llegamos a las siguientes ecuaciones:

(5) mi = 0 (6) B = 0 (7) × mi = 1 C B   t (8) × B = 1 C mi t

Aplicar ecuación ( 7 ) a mi ( X , y , z , t ) y B ( X , y , z , t ), y obtenemos:

(9) 1 C X t = norte y METRO z (10) 1 C Y t = L z norte X (11) 1 C Z t = METRO z L y

Del mismo modo, aplique la ecuación ( 8 ) a mi ( X , y , z , t ) y B ( X , y , z , t ), y obtenemos:

(12) 1 C L t = Y z Z y (13) 1 C METRO t = Z X X z (14) 1 C norte t = X y Y z

Estas relaciones se mantienen en el marco K. (Estas ecuaciones también asumen que los ejes x, y, z del marco K están en la configuración de la derecha)

Ahora, consideramos cómo funciona el vector mi ( X , y , z , t ) y B ( X , y , z , t ) se expresan en marco k utilizando las coordenadas ( ξ , η , ζ , τ ). Esto se puede lograr reemplazando X , y , z , t con ξ , η , ζ , τ usando ecuaciones ( 1 ) - ( 4 ).

Así obtenemos:

(15) mi ( X , y , z , t ) = mi ( β ( ξ + v τ ) , η , ζ , β ( τ + v ξ / C 2 ) ) (dieciséis) B ( X , y , z , t ) = B ( β ( ξ + v τ ) , η , ζ , β ( τ + v ξ / C 2 ) )

Usando la regla de la cadena de funciones multivariables compuestas:

X F ( tu ( X , t ) , v ( X , t ) ) = F tu tu X + F v v X

Lo aplicamos a cualquier función continua general.

F ( X , y , z , t ) = F ( β ( ξ + v τ ) , η , ζ , β ( τ + v ξ / C 2 ) )

De este modo

F ξ = F X X ξ + F y y ξ + F z z ξ + F t t ξ
De acuerdo con las ecuaciones ( 1 ) - ( 4 ), X ξ = β , y ξ = 0 , z ξ = 0 , t ξ = β v C 2 , obtenemos:

F ξ = β ( F X + v C 2 F t )

Esta relación se cumple para cualquier función continua general, así:

(17) ξ = β ( X + v C 2 t )
Similarmente:
(18) η = y (19) ζ = z (20) τ = β ( t + v X )

De la ecuación ( 20 ), obtenemos

(21) t = 1 β τ v X

Ecuación de enchufe ( 21 ) en la ecuación ( 17 ), obtenemos

(22) X = β ( ξ v C 2 τ )

Ecuación de enchufe ( 22 ) de nuevo en la ecuación ( 21 ), obtenemos

(23) t = β ( τ v ξ )

Ahora tenemos todas las herramientas que necesitamos para derivar la transformación de mi ( X , y , z , t ) y B ( X , y , z , t ) del cuadro K al cuadro k :

Aplicar ecuación ( 21 ) a la ecuación ( 9 ):

1 C 1 β X τ v C X X = norte η METRO ζ

De la ecuación ( 5 ):

X X + Y y + Z z = 0
De este modo
X X = Y η + Z ζ

Entonces se sigue que

1 C 1 β X τ + v C Y η + v C Z ζ = norte η METRO ζ
Reordenamos los términos y llegamos a
(24) 1 C X τ = η [ β ( norte v C Y ) ] ζ [ β ( METRO + v C Z ) ]

Aplicar ecuación ( 22 ) y ( 23 ) a la ecuación ( 10 ):

1 C β ( Y τ v Y ξ ) = L ζ β ( norte ξ v C 2 norte τ )
Reordenamos los términos y llegamos a
(25) 1 C τ [ β ( Y v C norte ) ] = L ζ ξ [ β ( norte v C Y ) ]

Del mismo modo, aplique la ecuación ( 22 ) y ( 23 ) a la ecuación ( 11 ), y reordenando los términos, obtenemos:

(26) 1 C τ [ β ( Z + v C METRO ) ] = ξ [ β ( METRO + v C Z ) ] L η

Luego pasamos exactamente por el mismo proceso, también utilizando el hecho de que de la ecuación ( 6 ) tenemos la relación:

L X + METRO y + norte z = 0

Así derivamos

(27) 1 C L τ = ζ [ β ( Y v C norte ) ] η [ β ( Z + v C METRO ) ] (28) 1 C τ [ β ( METRO + v C Z ) ] = ξ [ β ( Z + v C METRO ) ] X ζ (29) 1 C τ [ β ( norte v C Y ) ] = X η ξ [ β ( Y v C norte ) ]
dónde

β = 1 / 1 v 2 / C 2