Campo electromagnético como conexión en un haz de vectores

Me gustaría saber más sobre las conexiones de Ehresmann en haces vectoriales y cómo se relacionan con el campo electromagnético y el electrón en la mecánica cuántica.

Antecedentes: la ecuación de Schrödinger para un electrón libre es

( i ) 2 2 metro ψ = i t ψ

Ahora, para escribir la ecuación de Schrödinger para un electrón en un campo electromagnético dada por el vector potencial A = ( C ϕ , A ) , simplemente reemplazamos el operador de momento y tiempo con los siguientes operadores

i D i = i + mi A i t D 0 = i t mi ϕ

Escuché que esto representa una "derivada covariante", y me gustaría saber más al respecto.

Mis preguntas :

  1. (Delegado a Notación para Secciones de Paquetes de Vectores .)

  2. He oído que una conexión es una "forma única valorada en álgebra de mentira". ¿Cómo puedo visualizar eso? ¿Por qué toma valores en el álgebra de Lie de tu ( 1 ) ?

  3. Dado que una conexión es de una sola forma, ¿cómo puedo aplicarla a una sección? ψ ? Quiero decir, una forma única come vectores, pero ¿tengo una sección aquí? Que es D m ψ ( X m ) , ¿también es una sección?

Pido disculpas por mi aparente confusión, que es, por supuesto, el motivo de mis preguntas.

Tenga en cuenta que las preguntas separadas deben hacerse por separado en general, pero sus 3 preguntas en realidad parecen ser 3 partes de una pregunta, por lo que podría estar bien. Además, tal vez solo sea yo, pero no tengo claro exactamente a qué se refiere su pregunta 1. Si pudiera entrar un poco más en detalle allí, podría ayudarlo a obtener una respuesta más precisa.
Bueno, es que mi confusión es tan grande que no sé muy bien cómo hacer la pregunta correcta. :D creo que tengo una mejor idea de lo que quiero con la pregunta 1 ahora. Hm, probablemente debería dividirlos, incluso.

Respuestas (4)

Aquí hay una respuesta corta (-ish). Un fibrado vectorial es una familia de espacios vectoriales sobre una variedad. Los espacios vectoriales pueden tener bases. La variedad puede tener coordenadas. Los dos conceptos no están relacionados a priori (ahora para el haz de espacios tangentes , un cambio de coordenadas induce un cambio de base; este hecho a menudo genera confusión). Una vez que elige una base para su espacio vectorial, define un vector por sus componentes, pero alguien más puede estar describiendo el mismo vector en una base diferente. Para traducir a la física: cambio de base = transformación de calibre.

En el caso de una partícula cargada, la función de onda es la componente de una sección de un vector; en una nueva base, este número cambia por un número complejo distinto de cero (que puede variar de un punto a otro). Nuevamente, la función de onda es una sección, y una sección significa un vector para cada punto en la variedad. ¿Cómo diferenciamos una función que toma valores en diferentes espacios vectoriales sobre diferentes puntos? Necesitamos una forma de conectar los espacios vectoriales. La conexión hace esto; pragmáticamente, es solo una regla para hacer esta diferenciación.

Por supuesto, la diferenciación se verá diferente en diferentes espacios vectoriales, por lo que la forma de la conexión dependerá de la base y cambiará con las transformaciones de calibre (al igual que la forma de una transformación lineal cambia con el cambio de bases). Eso es lo que varias fórmulas desordenadas sobre cómo las cosas se "transforman" intentan decirte.

Buena respuesta. Y solo ahora me di cuenta de que olvidé por completo mencionar los paquetes de vectores, así que es bueno que se haya mencionado. Solo para hacerlo un poco más preciso: paquete vectorial V no es solo una familia de espacios vectoriales (excepto en el caso trivial del producto cartesiano) sino más bien un haz de fibras con fibra espacial vectorial. el punto sobre GRAMO -estructura PAGS es que actúa sobre este haz vectorial: la fibra de PAGS (que es difeomorfo a GRAMO ) sobre el punto X Actúa sobre la fibra de V sobre el mismo punto. Entonces decimos que V se transforma en alguna representación de GRAMO (por ejemplo, escalar, espinor, etc.).
Antes que nada, ¡gracias por responder! Por cierto, ψ ( X ) en sí mismo no es una sección en el paquete vectorial, es la imagen de una sección en una trivialización local π 1 ( tu ) tu × C . En una trivialización local diferente, es decir, después de un cambio de calibre, la imagen es mi i x ( X ) ψ ( X ) . Hasta aquí todo bien.
Ahora, lo que me pregunto es esto: para un campo vectorial v (= una sección del haz tangente), puedo escribir v = v m X m . Esta expresión es invariable porque menciona explícitamente el sistema de coordenadas X m . A diferencia de, " ψ ( X ) " no es una notación invariable para la sección de un tu ( 1 ) paquete de vectores, porque no especifiqué la trivialización local. ¿Hay una notación para hacerlo explícito también, como para v ? (Pregunto porque me cuesta pensar en coordenadas si no puedo escribirlas de forma invariable).
Hola a todos. La razón por la que di mi respuesta de la forma en que lo hice es que la precisión, especialmente la notación y el lenguaje, puede ofuscar. El interrogador parecía desconcertado por la estructura general de la historia. Dicho esto, es cierto que una variedad de respuestas ciertamente puede ayudar a una variedad de lectores. Para Greg: si realmente quieres, puedes poner un índice en \psi que indique que es un vector único.
@Eric: Estoy bien con la idea general, pero tengo problemas para armar los detalles. Dividí la pregunta y convertí la parte 1 en una pregunta separada .
@Greg: actualicé mi respuesta para abordar esta pregunta (espero que ayude). @Eric: ciertamente tienes razón y daría tu explicación como una introducción al tema para un recién llegado completo (lo que no significa que sea malo; al contrario, me gusta mucho). Pero me pareció que Greg ya sabe un poco sobre estas cosas y también está versado en las matemáticas de la geometría diferencial, así que decidí hacer mi respuesta un poco más técnica (sé que me hubiera gustado ver este punto matemático de ver cuando yo mismo estaba aprendiendo estas cosas).
Me parece que la conexión elegida es esencialmente arbitraria, al menos localmente. (Creo que puedo imaginar que diferentes conexiones podrían conducir a diferentes estructuras diferenciales globales, aunque mi terminología podría ser incorrecta, lo siento). Pero cualquier arbitrariedad en la conexión es arbitrariedad en A . Ahora A tiene mucha libertad de calibre, por lo que no es tan sorprendente, pero ¿sería realmente cierto que solo la estructura de conexión global afecta la parte física de A ? En resumen, ¿qué tan física es la elección de la conexión? (Perdón por revivir esta publicación tan antigua).
  1. No estoy muy seguro acerca de esta pregunta. ¿Quizás solo estás preguntando sobre la notación? Puedes elegir lo que quieras. Pero por lo general eliges un sistema de coordenadas y solo trabajas en eso. Ciertamente, no es un problema si está trabajando en un espacio-tiempo plano: allí tiene buenas coordenadas globales para todo.

    • La primera frase es correcta. Para grupo de mentira arbitrario GRAMO con álgebra de mentira gramo puede obtener una llamada estructura G (por ejemplo, O ( norte ) -estructura para variedades de Riemann) y puede definir una conexión en eso. Son matemáticas bastante pesadas, pero al final del día obtienes una gramo -valorado (más precisamente, toma valores en la representación adjunta de gramo ) de una sola forma ω y derivada covariante D m como el que has escrito.

    • En general, visualizo conexiones como esta: pones un vector y la conexión te devuelve un elemento del álgebra de Lie que es un generador de alguna transformación en el grupo de Lie. Por ejemplo, en una variedad de Riemann, inserta en la conexión la dirección a la que desea ir y obtendrá información (dicho muy aproximadamente) sobre cuánto se curva el espacio en esa dirección. Más precisamente, si integras γ Exp ( ω ( γ ˙ ( t ) ) ) d t obtienes algún elemento T GRAMO que te dice cómo cualquier vector se transporta en paralelo a lo largo de la curva cerrada γ (esto se llama holonomía).

    • En cuanto a la última pregunta de por qué tu ( 1 ) : bueno, porque es electromagnetismo. Varios grupos le darán varias interacciones (por ejemplo, S tu ( 3 ) te da QCD). Estos grupos surgen porque las teorías contienen algo llamado simetría de calibre. Estoy seguro de que sabe que las ecuaciones de Maxwell, cuando se escriben en A y ϕ , son invariantes a ciertas transformaciones. Más concreta y claramente, como F = d A , dónde F es el tensor electromagnético y A es el cuatro potencial. De esta forma es obvio que las ecuaciones para F no cambies con la transformación A = A + d x . Ahora, retrocedamos a ψ y tenga en cuenta que si desea que la teoría sea localmente invariable (¿por qué haría eso? porque es bueno tener propiedades locales en lugar de globales. Y la teoría es claramente invariable con respecto al cambio de fase global, así que intentemos esto) con respecto al cambio de fase, tendrás que introducir nuevo grado de libertad A ¡que se transforma precisamente como el potencial cuádruple en la teoría de Maxwell! En realidad, lo que acabamos de hacer es que recuperamos fotones. Entonces, para concluir: si eliges tu ( 1 ) como un grupo de simetrías, aparece el electromagnetismo. Pero tenga en cuenta que para incorporar todo esto de manera consistente, debe trabajar en el marco de la teoría cuántica de campos porque la ecuación de Schrödinger claramente no es relativistamente invariante, que es una característica que seguramente nos gustaría tener en la teoría del electromagnetismo.

  2. Esto puede ser un poco confuso, especialmente en la literatura física y dudo que realmente pueda aclararlo. Probablemente esto solo lo confundirá aún más, pero aquí va: existen varios espacios de secciones y GRAMO -estructuras y representaciones de ambos GRAMO y gramo entre los que uno realmente debería discernir pero que están identificados en la física. Hacer esto riguroso tomaría demasiado espacio, por lo que le sugiero que consulte algunos libros sobre teoría de indicadores. Solo te diré que el vector (más precisamente el campo vectorial ) también es una sección y viceversa. Pero tenga en cuenta que aquí se mezclan otros dos términos: vector abstracto como concepto del álgebra lineal (este es nuestro ψ : sabes que es este tipo de vector porque no tiene índice de espacio-tiempo m ) y el vector como un elemento del espacio-tiempo de Minkowski, digamos V m . En cuanto a D m , actúa (por extensión) también sobre el álgebra tensorial del espacio de secciones ψ (en este caso simple donde ψ no tiene índice, el álgebra de tensores es isomorfa al álgebra de tensores de tangente normal) y te da una forma de vivir en este álgebra de tensores, así que sí: ¡es una sección, pero en un espacio totalmente diferente (aunque isomorfo)!

No necesitas disculparte. Estas cosas son bastante difíciles y se necesita mucho tiempo para asimilarlo todo y supongo que muchos físicos simplemente descartarían la mayor parte del contenido matemático y seguirían adelante para calcular algo. Lo cual es posible aquí porque tu ( 1 ) es solo unidimensional, su álgebra de Lie es unidimensional, y también lo es ψ . Así que solo trabajas con números todo el tiempo y no surge la necesidad de conceptos abstractos. Excepto que esto no te ayuda ni un poco cuando intentas generalizar esto (ya sea a QCD con grupo no abeliano S tu ( 3 ) , o al espaciotiempo curvo), o incluso si tratas de pensar en algunos conceptos que son bastante básicos desde el punto de vista de la geometría (por ejemplo, intenta pensar en cuál es el significado de la holonomía mencionada anteriormente con respecto a γ En el caso de tu ( 1 ) ). Así que es bueno que ya estés tratando de entender los principios básicos.


Actualización con respecto a la pregunta de Greg en los comentarios:

No estoy seguro de entenderlo completamente, pero tengo la sensación (probablemente equivocada) de que está mezclando varias nociones de invariancia aquí. Hay al menos dos nociones de invariancia física (bajo la acción del grupo de Lorentz y bajo la acción de tu ( 1 ) ) y también una noción de invariancia en el sentido de ser "libre de coordenadas". Ahora, si mi sentimiento es correcto, estás pidiendo un análogo de v = v m X m por ψ . Estas dos cosas son realmente muy similares, pero de una manera un poco disfrazada. Más precisamente: v es una sección de un haz tangente T METRO y lo estamos descomponiendo con respecto a alguna sección del paquete de marcos tangentes canónicos F METRO , que también conlleva una acción natural del grupo GRAMO L k ( R ) (la acción es un cambio local de base y k es el rango de T METRO ). En otras palabras, tenemos un GRAMO -estructura aquí y aquí es donde viene la invariancia "sin coordenadas". La situación es similar con ψ : es una sección de un paquete vectorial π : V METRO que lleva un tu ( 1 ) -estructura. En este punto también debe quedar claro dónde está la diferencia entre los dos casos: en el primero tienes dos paquetes T METRO y F METRO mientras que en el segundo solo hay π : V METRO . Así que realmente no tiene sentido pedir ψ ser más invariable de lo que ya es: no tienes nada con respecto a lo que puedas descomponerlo. Así que en lugar de pensar en ψ como un análogo de la sección de T METRO , piénselo en cambio como un análogo de una sección de F METRO .

Solo para ser quisquilloso: una conexión se especifica mediante una forma única con valores en el álgebra de Lie (no en el paquete adjunto); pero esta es una forma única en el paquete principal asociado. solo obtiene una descripción de formulario en el colector base localmente. Puede confundirse con la curvatura que se puede ver como una forma en la variedad base con valores en el paquete adjunto.
@Eric: ¡gracias por ser quisquilloso! Lo que quise decir es que es una forma en la representación adjunta del álgebra de Lie (¿verdad?). Pero cierto, esta parte es bastante confusa. Lo pensaré y trataré de reescribirlo.
@Eric: en cuanto a la curvatura: AFAIK localmente, la curvatura es de dos formas con valores en el representante adjunto. de álgebra de mentira. Entonces, en este sentido, es lo mismo que la conexión. Ambos se pueden representar también en un paquete adjunto. ¿O esto no es así?
Bueno, si está trabajando en un paquete de vectores, las formas de conexión solo se definen en relación con un marco local. Si los une para obtener algo global, entonces no toma valores en ningún paquete agradable. Sin embargo, la forma de curvatura es una forma global de dos con valores en el representante adjunto. Pero si pasa de un paquete vectorial a su paquete principal asociado, entonces la forma de conexión es una forma global 1 en el paquete principal con valores en el álgebra de Lie (no rep ad) y la forma de curvatura es una forma 2 en el paquete principal con valores en el álgebra de Lie.
@Eric: Ya veo, ¡gracias por la aclaración! Definitivamente necesito pensar más sobre estas cosas (sin duda necesitaría una conferencia puramente matemática sobre haces de fibras y haces principales; en este momento estoy parcheando mi conocimiento matemático de los bits que aprendí en la literatura física) y actualizaré mi respuesta entonces.

Puedo entender perfectamente tu confusión ya que es natural que te sientas abrumado por este nuevo punto de vista sobre la teoría.

Las respuestas dadas por Eric y Marek están bien y no hablaré directamente sobre paquetes principales, trivialización local y cosas por el estilo. Quiero presentar un enfoque muy intuitivo aquí.

Le sugiero que retroceda uno o dos pasos e intente comprender la noción de una derivada covariante en la geometría diferencial clásica. Allí, la derivada covariante D asegura que si se deriva alguna cantidad F en una variedad, digamos alguna superficie, esta nueva cantidad D F también estará "sobre la variedad" (en realidad, algo relacionado con ella, como el espacio tangente).

Con suerte, el siguiente ejemplo ilustrará el problema de lo que significa que algo tiene que "permanecer en el colector".

Punto de masa en una superficie

Bien, hagamos el ejemplo más simple que se nos ocurra, el movimiento de un punto de masa libre sobre una superficie en la mecánica newtoniana. Como saben, el Lagrangiano en este caso es solo la energía cinética,

L = T = metro 2 v 2

Entonces, ¿qué es ahora? v 2 ? Tenemos que suponer que en cada punto, la velocidad es tangencial a la superficie. Entonces, sabemos que v 2 = gramo a b X ˙ a X ˙ b donde sumamos los índices y la superficie se describe mediante alguna métrica gramo a b ( X ) d X a d X b y hemos reemplazado la velocidad por la derivada temporal de la posición de la partícula.

Para la solución del sistema necesitaremos dos términos. En primer lugar, queremos calcular

L X k = metro 2 k gramo a b ( X ) X ˙ a X ˙ b

segundo,

d d t L X ˙ k = d d t metro 2 gramo a b ( X ) ( d k a X ˙ b + X ˙ a d k b ) = metro d d t gramo k b ( X ) X ˙ b

ya que gramo es simétrico Ahora,

metro d d t gramo k b ( X ) X ˙ b = metro ( yo gramo k b ( X ) X ˙ yo X ˙ b + gramo k b ( X ) X ¨ b )

Finalmente, las ecuaciones de movimiento están dadas por

d d t L X ˙ k L X k = 0

y eliminando m, reutilizando la simetría en gramo y renombrando algunos índices, llegamos a

gramo k b X ¨ b + 1 2 ( a gramo k b + b gramo k a k gramo a b ) X ˙ a X ˙ b = 0

que es exactamente aplicando gramo i k

X ¨ i + Γ a b i X ˙ a X ˙ b = 0

Donde los símbolos de Christoffel pueden verse directamente como

Γ a b i = 1 2 gramo i k ( a gramo k b + b gramo k a k gramo a b )

y espero no haber calculado nada mal.

Relación con la electrodinámica

Ahora bien, esta ecuación de movimiento ya es mágica ya que es precisamente la ecuación de movimiento para una partícula de prueba en la relatividad general . Pero, ¿qué pasa con (otras) teorías de campo gauge?
Aquí, la curvatura no se define con respecto a la variedad directamente sino a un grupo de alguna manera "unido" a ella. Es por eso que tendrá algunos índices de grupo, pero uno puede descartar esto si el álgebra de mentira del grupo es unidimensional como en el caso de la electrodinámica. Allí, nuestra curvatura es F m v pero también podríamos afirmar F m b v a donde ahora a y b son índices del grupo. Esto parece mucho más familiar a la curvatura de la relatividad general, R v α β m donde todos los índices corresponden a la variedad, en algún sentido, el espacio tangente es el grupo de la relatividad general, en términos generales.

Por razones históricas, los símbolos de Christoffel que de alguna manera captan (¡no invariablemente!) la fuerza que actúa sobre la partícula debido a la curvatura se denominan campos de medida en las teorías de medida. A y reescalado,

β A m b a d X m "=" Γ m b a d X m

con índices de nuevo grupo a y b .

Ahora, si deriva algo en la variedad, siempre tendrá que definir esa derivada con respecto a los Símbolos de Christoffel para permanecer "en la variedad". Por otro lado, la derivación también deberá respetar el carácter grupal, se podría decir que el resultado debe permanecer "en el grupo". Esto se realizará mediante una derivada covariante y aquí los "símbolos de Christoffel" se denominan campos de calibre.

Sinceramente

Roberto

Agregué formato a tus ecuaciones. Por cierto, solo una pequeña pregunta de terminología: ¿es F m b v a ¿estándar? Estoy más acostumbrado (y también creo que es más natural) a juntar los índices de tensor y los índices de álgebra de Lie para enfatizar que F es en realidad una forma de dos con valores en un álgebra de Lie. Como en F m v a b .
@Marek: Tienes toda la razón, solo quería que la correlación con la curvatura relativista general fuera obvia. La respuesta tampoco debe verse como una competencia con la suya o la de Eric, es solo otro enfoque para familiarizarse con el término derivada covariante desde una perspectiva diferente.
@Robert: Claro, no tengo ningún problema con tu respuesta. Al contrario, me gustó mucho y le di +1 (olvidé hacerlo antes por la edición y el comentario :-)). Me preguntaba si esa notación es estándar (varias escuelas/libros/personas usan todo tipo de notación inusual) porque no la he visto antes.
@Marek: Gracias :) La mecánica lagrangiana es la teoría más hermosa de todas para mí. Siempre trato de captar una idea de cosas nuevas desde su perspectiva.
Su ejemplo está tan bien pensado como la mecánica hamiltoniana, y es parte de una historia general (¡y simple!). En el paquete cotangente de una variedad de Riemann (equivalentemente, el paquete tangente: los dos son iguales cuando tiene una métrica), puede tomar el hamiltoniano como la energía, o la longitud al cuadrado/2 del vector de velocidad, como has hecho. Entonces, el flujo hamiltoniano es igual al flujo geodésico. Esto es lo que has demostrado en tu ejemplo.

El mejor libro que he visto sobre esto es de Chris Isham llamado Modern Differential Geometry for Physicists . Es pesado porque hace todo con rigor, pero al final vale la pena por la clarificación conceptual.

Hay básicamente dos conceptos que uno tiene que dominar: paquetes principales y paquetes vectoriales. La noción de una conexión se puede definir en ambos de forma independiente y es útil saber cómo traducir entre los dos.

Un paquete principal tiene un grupo de estructura, generalmente conocido en física como el grupo de calibre, y la construcción principal que le da un paquete vectorial a partir de este se denomina paquete asociado, que se obtiene al proporcionar una representación del grupo de estructura/calibre.

1) La notación es pesada porque hay una gran cantidad de detalles para controlar. Cada paso es sencillo, pero es la gran cantidad de él.

2) Una conexión en un paquete principal mi es un desdoblamiento de su haz tangente T mi en un paquete vertical V mi y un paquete horizontal H mi que es equivariante , esto quiere decir que es compatible con la acción del grupo estructural sobre las fibras. La conexión 1-forma surge de observar que podemos identificar las fibras del haz vertical con el haz tangente del grupo GRAMO Al origen mi , eso es lo que obtenemos T mi GRAMO , y esta es exactamente el álgebra de Lie del grupo.

3) Uno no usa el formulario de conexión 1 directamente en la forma que ha indicado. En cambio, se construye una derivada covariante a partir de la forma 1 de conexión y esta en sí misma no es una forma 1.

Vale la pena señalar que los paquetes principales y vectoriales y las conexiones en ellos son construcciones globales, mientras que las construcciones que uno suele ver en física son típicamente locales. Para obtener la imagen local, generalmente se toma una sección del paquete y luego se retira la estructura geométrica.

Este fue un punto que me confundió. Por ejemplo, la conexión matemática de forma 1 es global, pero la conexión física de forma 1 es local y son diferentes.