Pequeña confusión sobre el efecto Aharonov-Bohm

Soy mayormente consciente de la interpretación física del efecto Aharonov-Bohm (efecto AB), así como de la interpretación geométrica matemática/diferencial correspondiente.

Sin embargo, lo que me confunde un poco es la parte física de la derivación que conduce a ella. Es decir, en una descripción "heurística", por lo general se mencionan las trayectorias, es decir, que "un electrón que va en un sentido y otro en sentido contrario alrededor del cilindro detectará un cambio de fase" o "un electrón que circule alrededor del cilindro captará un cambio de fase en comparación con su valor original".

Sin embargo, en QM no hay trayectorias, aunque, por supuesto, existe el punto de vista de la integral de la ruta, y sé que el efecto AB también se puede abordar desde esta perspectiva (Sakurai, por ejemplo). Peeeero, en un libro de texto húngaro he visto una forma particularmente simple de derivar el cambio de fase.

Dejar C sea ​​el cilindro (sólido) en R 3 y deja METRO = R 3 C . el múltiple METRO no es contraible, por lo que no se aplica el lema de Poincaré. En particular, si A es el vector potencial,

× A = B = 0
no implica que exista un campo escalar definido globalmente x tal que A = x .

Dejar ψ sea ​​la función de onda que satisface la ecuación de Schrödinger

i t ψ = 2 2 metro D 2 ψ
con
D = + i q A
la derivada covariante. Supongo que la interpretación correcta debería ser que ψ simplemente describe el estado de un electrón que se difracta en el cilindro. Dejar ψ 0 Sea la función de onda correspondiente al caso de A = 0 .

Ahora, dividamos METRO en dos mitades, METRO + y METRO tal que ambos dominios son contráctiles. Como son contraíbles, con B = 0 , uno puede elegir transformaciones de calibre x + y x apagar" A . Dejar caer el ± signos, esta función de calibre está dada por

x ( X ) = X 0 X A ( y ) d y
donde la integral se realiza sobre cualquier curva que conecte el punto inicial arbitrario X 0 con el punto de destino X (ya que la integral es independiente de la trayectoria).

Desde x apaga A (en uno de los METRO ± dominios), tenemos

ψ 0 ( X ) = mi X A ( y ) d y ψ ( X ) .

Invirtiendo, tenemos

ψ ( X ) = mi X A ( y ) d y ψ 0 ( X ) .

Ahora realizamos este procedimiento en ambas trivializaciones y las comparamos:

ψ + ( X 1 ) / ψ ( X 1 ) = mi γ + X 1 A ( y ) d y mi γ X 1 A ( y ) d y = Exp ( A ( y ) d y ) .
(Probablemente se me han caído algunos q arena está en alguna parte, pero no afecta el método básico)

Pregunta:

Me imagino que si realmente ocurre la difracción en el cilindro, entonces el electrón difractado se describe mediante una función de onda. ψ , en particular, una función de onda que tiene un solo valor .

Si la función de onda es de un solo valor, entonces deberíamos tener un bien definido ψ ( X 1 ) , y no podemos tener diferentes ψ + ( X 1 ) y ψ ( X 1 ) funciones de onda

Sin embargo, a pesar de lo que sugeriría el trasfondo teórico de la conexión, en realidad no calculamos un transporte paralelo, sino una transformación de calibre. Por lo tanto, las dos funciones de onda no tienen por qué coincidir, ya que tienen diferentes calibres. Sin embargo, entonces, ¿ por qué los comparamos ? Compararlos y decir que difieren sería como comparar un vector consigo mismo en dos sistemas de coordenadas diferentes y decir que difieren porque las componentes no concuerdan.

Entonces

  • Si esta derivación es "correcta", ¿por qué comparamos funciones de onda en diferentes calibres? En particular, ¿por qué esperamos obtener resultados físicamente significativos de eso?

  • Si la derivación es incorrecta, ¿cuál es una forma sencilla de mostrar que el cambio de fase viene dado por A , que no se basa en integrales de trayectoria ?

Esta derivación es un ejemplo de exceso de formalismo matemático que confunde a la física. Se puede hacer bien, pero por el momento es completamente incorrecto físicamente, porque no utiliza el hecho de que la carga debe moverse lentamente. Simplemente está haciendo operaciones matemáticas que parecen familiares hasta que la respuesta cae por accidente.
@knzhou Desde que hice esta pregunta, he podido consultar otras fuentes (por ejemplo, el libro de Ballantine), que contienen la misma derivación: configure dos trivializaciones superpuestas y calibre transforme una función de onda "libre" por separado. Ninguna fuente sobre el efecto AB que he leído nunca dijo nada sobre las cargas que necesitan moverse lentamente. ¿Por favor elabora?
Sí, lo haré una vez que llegue a una computadora.

Respuestas (3)

Esta "derivación" me molesta, que es que los tratamientos matemáticos de las fases topológicas confunden persistentemente el cambio de fase que resulta de un proceso físico con fases abstractas, físicamente sin sentido, calculadas al conectar ciegamente ecuaciones entre sí.

Fases Física y Formal

El efecto Aharanov-Bohm ni siquiera es el peor ejemplo; ese premio es para anyons. Cualquiera toma una fase mi i ϕ cuando sus posiciones se intercambian físicamente , es decir, cuando dos de ellos son cogidos e intercambiados por un experimentador, asumiendo que no hay campos externos adicionales, los anyons se mueven lentamente, y así sucesivamente. Sin embargo, esto se confunde persistentemente con la fase que resulta del intercambio formal de dos variables en la función de onda de muchos cuerpos,

ψ ( X 1 , X 2 , ) = mi i θ ψ ( X 2 , X 1 , ) .
Es trivial demostrar que esta fase formal es siempre ± 1 en cualquier dimensión, lo que lleva incluso a matemáticos muy capaces a afirmar que los anyons no pueden existir . La mayoría de los libros de introducción a la mecánica cuántica que intentan tratar a los anyones cometen precisamente este error, luego murmuran algo incorrecto sobre la topología que permite que la fase formal difiera de ± 1 . Es un desastre. (Para un buen tratamiento, ver aquí .)

De manera similar, la fase de Aharanov-Bohm es el hecho de que una partícula toma una fase extra mi i θ al ser transportado alrededor de un flujo. Es fácil ver de dónde provienen tanto la fase de Aharanov-Bohm como la de Anyon si usa la integral de trayectoria. Los estudiantes con mentalidad matemática a menudo descartan este argumento, basado en trayectorias, como "heurístico", pero no entienden el punto, porque la física de la situación se trata explícitamente de trayectorias. No puede ver fácilmente el cambio de fase entre dos trayectorias si utiliza la ecuación de Schrödinger independiente del tiempo.

Si no le gusta la integral de trayectoria, también puede derivar estas fases con el teorema adiabático: atrapar una partícula en una caja en la ubicación R y transporte la caja alrededor del fundente. La conexión del calibre A funciona precisamente como la conexión Berry en los estados | R , y la derivación procede exactamente de la misma manera que la derivación formal del haz de fibras a continuación. Tenga en cuenta que tanto en la integral de trayectoria como en el teorema adiabático se requiere explícitamente que el transporte sea lento. En el primer caso, es para evitar recoger más pag d X fases, y en este último caso es una condición del teorema adiabático.

Una derivación correcta del haz de fibras

El argumento que diste se basa en comparar funciones de onda en dos indicadores diferentes, lo cual no tiene sentido físicamente. Aquí hay una derivación correcta.

Como sabe, podemos describir el campo de calibre en términos de un tu ( 1 ) -abrázate METRO . Todos estos paquetes son triviales, por lo que la mayoría de los cursos no hablan de ellos; simplemente hace las cosas más complicadas. Sin embargo, supongamos que elegimos usar paquetes de todos modos y cubrimos METRO con dos parches. Entonces podemos calcular la fase recogida al transportar una partícula alrededor del flujo de la siguiente manera.

  • En el primer parche, integre A d X .
  • Cuando la partícula pase del primer parche al segundo, agregue una fase para tener en cuenta la función de transición entre los parches.
  • En el segundo parche, integre A d X .
  • Cuando la partícula pasa del segundo parche al primero, agregue otra fase de función de transición.

Dado que el paquete es trivial, las funciones de transición se pueden elegir para que sean triviales, reduciéndose al formalismo de no paquete. Sin embargo, también podríamos optar por medir la conexión dentro de cada parche. Luego, la partícula no capta ninguna fase, ya que se transporta en paralelo a través de los parches (nuevamente, suponiendo que se mueve lentamente, sin campos externos adicionales, ignorando las fases dinámicas, etc.), pero capta fases de funciones de transición no triviales. Por supuesto, dado que la respuesta es una cantidad física, será la misma calculada de cualquier manera. Su texto acaba de mostrar esto explícitamente.

Usando la derivación falsa

La comparación de funciones de onda en dos calibres diferentes no tiene nada que ver con el proceso físico en el efecto Aharanov-Bohm, pero su texto obtiene la respuesta correcta básicamente por accidente; solo hay una respuesta que podría obtener en esta situación simple. Afortunadamente, la configuración de su texto es útil para otra cosa: encontrar el espectro de partículas en un anillo.

Supongamos que una partícula está restringida a un anillo, a través del cual pasa un flujo. Si no hubiera flujo, los estados propios de energía serían

ψ norte ( θ ) mi i norte θ , mi norte norte 2 .
Ahora suponga que el flujo está encendido, dando una fase de Aharanov-Bohm mi i ϕ . Por lo general, para obtener el espectro, debe resolver la ecuación de Schrödinger con un potencial vectorial, pero al usar la configuración del paquete de fibra, podemos establecerlo en cero en cada parche. Supongamos que configuramos una de las funciones de transición para que también sea trivial, y dejamos que la otra intersección del parche esté en θ = 0 , tenemos
límite θ 0 + ψ norte ( θ ) = mi i ϕ límite θ 2 π ψ norte ( θ )
dónde ψ norte ( θ ) satisface la ecuación de Schrödinger para el vector potencial cero. (Por supuesto, la función de onda sigue siendo de un solo valor, siempre que recordemos que solo tiene sentido compararla consigo misma dentro de un parche). Entonces tenemos
ψ norte ( θ ) mi i ( norte ϕ / 2 π ) θ , mi norte ( norte ϕ / 2 π ) 2
lo que da un cambio medible en el espectro. Este es un caso en el que desea la ecuación de Schrödinger independiente del tiempo, no las trayectorias integrales de trayectoria, pero eso se debe a que la física es completamente diferente.

Gracias por la respuesta. Mi único problema es que en la "derivación del haz de fibras" que proporciona, me parece no trivial motivar que la cantidad de interés es A . Tal vez en realidad es trivial, pero no puedo verlo ahora. ¿Podría proporcionar una fuente que trate este asunto con rigor, pero preferiblemente sin el formalismo integral de ruta? Para que sea más comprensible lo que estoy buscando, voy a dar una historia de fondo. A menudo ayudo a mi supervisor con el seminario de práctica de un curso de GR que imparte (hago investigación en GR). Su curso no es muy matemático, por lo que a menudo cubro algunos (continuación)
del fondo geométrico diferencial en el seminario de prácticas. Conozco una buena y rigurosa prueba de que la desaparición del tensor de curvatura (en una región abierta) implica holonomía trivial, si el bucle es homotópico nulo. No conozco ningún ejemplo GR simple de mostrar de holonomía plana, así que para mostrar la consecuencia de las obstrucciones topológicas, pretendo mostrar el efecto AB como ejemplo. Sin embargo, prefiero un enfoque de todo o nada, y creo que quizás el punto más estricto de todo esto es motivar físicamente que el cambio de fase esté relacionado con A .
La razón por la que quiero evitar las integrales de ruta a menos que sea absolutamente necesario es que nuestros cursos habituales de QM no lo cubren, por lo que no quiero sobrecargar el seminario con integrales de ruta también.
@Uldreth Bueno, A cae fuera de la acción clásica (donde se explica el electromagnetismo agregando un A d X término), y como usted sabe, la integral de trayectoria usa directamente la acción clásica en mi i S . Entiendo por qué es posible que no quieras usarlo, pero el vínculo entre las fases cuánticas y la acción clásica es realmente fundamental, por lo que no usarlo hace que todo sea mucho más difícil. Sin embargo, puede arreglárselas usando la fase Berry en su lugar.
@Uldreth Mencioné esto brevemente anteriormente, pero la fase Aharanov-Bohm también se puede ver como una fase Berry asociada con el transporte lento de la posición de la partícula R en un bucle, donde la conexión Berry es la conexión de calibre. Puede buscar derivaciones de esto simplemente buscando en Google esas palabras clave. Así que eso podría funcionar.
@Uldreth De hecho, aquí hay posiblemente una mejor manera: primero argumente que la fase Berry es exactamente cero cuando A = 0 . (Si eres astuto, incluso podrías asumir esto tácitamente sin decirlo; la mayoría no lo notaría). Entonces, la única fase que recoges mediante el transporte en un bucle es de la función de transición. Finalmente, use el argumento de su libro a la inversa para mostrar que, al deshacer las transformaciones de calibre que hicieron (que no deberían cambiar la fase física), esa fase de la función de transición es precisamente A .
Solo me preguntaba, ¿no debería ser posible derivar esto de la ecuación de Schroedinger independiente del tiempo sin usar ningún cambio adiabático? (¿y sin integral de trayectoria?)

El proplem original de Bohm-Aharonov [Y. Aharonov y D. Bohm Phys. Rev. 115, 485 (1959)] se trata de electrones que se dispersan desde un solenoide. Dan una buena solución a la ecuación de Schrödinger como una suma de funciones de Besssel que es divertido de graficar:Bohm con 1,4 unidades de flujo a través del solenoide

La imagen es la parte real de la función de onda para el caso de 1/4 de unidad de flujo a través del solenoide. Ola entrante desde la derecha. El cambio de fase BA da como resultado que las crestas de onda aguas abajo por encima y por debajo se compensen en 1/4 de longitud de onda. Sin embargo, la función de onda en sí misma tiene un solo valor en todas partes.

Si la derivación es incorrecta, ¿cuál es una forma sencilla de mostrar que el cambio de fase viene dado por , que no se basa en integrales de trayectoria?

Si bien el cambio BA se ha confirmado experimentalmente muchas veces, creo que todas esas derivaciones del efecto físico (cambio) basadas en argumentos matemáticos sobre A fuera del solenoide no son convincentes, tal vez completamente inválidos.

El principal problema es que todas esas derivaciones asumen que la integral del bucle a lo largo del bucle S alrededor del solenoide es igual al flujo magnético a través de la superficie S que está definido por el bucle:

S A d yo = S B d S       ( 1 )

Si bien esto es cierto para los potenciales vectoriales considerados en la mayoría de las situaciones discutidas en los libros de texto de física, no es necesariamente una propiedad de un potencial vectorial. Las únicas condiciones que restringen el vector potencial en la teoría EM son

B = × A ,
mi + φ = t A .

De la primera condición se puede derivar la fórmula (1), pero sólo si A se comporta bien en todos los puntos de la superficie (incluida la superficie y el interior del solenoide). Si no lo es (si hay discontinuidad o singularidad), la derivación falla. En consecuencia, hay funciones válidas A ( X ) que, al integrarse fuera del solenoide, no obedecen (1).

Por ejemplo, hay una función A 0 ( X ) que desaparece fuera del solenoide (por lo que da × A = 0 trivialmente) y solo es distinto de cero dentro del solenoide. También tiene, necesariamente, discontinuidad en la superficie del solenoide (o bien, hay otra función que es continua en la superficie, pero luego tiene singularidad dentro del solenoide). Entonces la relación B = × A falla en la superficie del solenoide, pero eso es cierto para todas las funciones, incluida la estándar, si la distribución de corriente en la superficie del solenoide es infinitamente delgada.

Estos detalles no deberían influir en la solución de la ecuación de Schroedinger si el solenoide se modela como una barrera de potencial infinito (ciertamente, esto no está muy claro y tal vez haya un efecto de discontinuidad o singularidad incluso a través de la pared de potencial infinito...).

Solo cuando restringimos el potencial vectorial a la familia que tiene una integral de bucle distinta de cero, podemos obtener algún efecto del flujo magnético en el ψ función.

Por estas razones, creo que es bueno 1) buscar algún argumento de por qué solo se permiten ciertos potenciales vectoriales (lo que no parece ser muy fructífero, considerando que son solo una herramienta auxiliar para obtener el campo físico) o 2) busque otras explicaciones, preferiblemente aquellas que no se basen en la propiedad especial del vector potencial.

Ha habido algunos trabajos intrigantes sobre la posibilidad de una explicación clásica del cambio BA, véanse, por ejemplo, los artículos de Timothy Boyer, quien argumenta que existe una interacción EM clásica entre los electrones y el solenoide metálico, lo que sugiere que la explicación podría ser mucho más clásico y no requiere propiedades especiales de potencial vectorial:

https://philpapers.org/rec/BOYCEA

https://link.springer.com/article/10.1023%2FA%3A1003602524894

Esto suena a exceso de formalismo matemático que enturbia un punto físico muy simple. El potencial vectorial en un solenoide ideal no es singular. A menudo se escribe explícitamente en las clases de electromagnetismo de nivel de primer año. No hay ninguna razón por la que deba ser singular, a diferencia del monopolo magnético, ya que el haz de fibras aquí es trivial.
Usted es libre de confundirse obligándose a trabajar con potenciales de calibre artificialmente singulares, pero eso no invalida la derivación real, que es perfectamente sencilla.
Re "potenciales de calibre singulares artificiales": ¿cree que algunos potenciales vectoriales son más correctos fuera del solenoide que otros, incluso si todos satisfacen la definición? × A = B en esa región? No. El potencial vectorial no tiene que ser diferenciable en todas partes.
Creo que todo lo real no solo es diferenciable, sino infinitamente diferenciable. Así que creo que ir en contra de este principio, incluso para algo no observable como el potencial de calibre, es físicamente inaceptable.
Diferenciables o discontinuos, estas son solo propiedades de los modelos físicos. Cada uno es útil en algunas situaciones. Hay mucha ocurrencia de funciones no diferenciables en física y generalmente no es un problema. Podemos diferenciar incluso tales funciones, con la ayuda de distribuciones delta.
Estoy seguro de que puede optar por representar algo suave con algo singular, pero esto hace que las cosas sean más confusas artificialmente. Si, al hacer esta elección, inadvertidamente te confundes pensando que el efecto Aharanov-Bohm no existe, eso no es una refutación, es solo tu culpa.
Tomemos el ejemplo de la función delta de Dirac. Eso surge en la normalización de los estados de posición en QM. Si no aceptó los deltas de Dirac, podría argumentar erróneamente que eso significa que los estados de posición no pueden existir, por lo que la ecuación de Schrödinger debe modificarse. Pero eso es entenderlo todo mal; el problema aparente solo proviene del uso de objetos singulares en su modelo, y puede reformular todos los resultados físicos sin usar nada singular.
Sigues insistiendo en que estoy confundido, pero hasta ahora no has dado argumentos para eso. No existe una regla en física o matemáticas que prohíba el uso de funciones que tengan discontinuidad o singularidad. Eso es cierto para cantidades físicas como mi , B , j , ρ . Y aún más cierto para funciones auxiliares no físicas como A . Muchos modelos útiles manifiestan tales discontinuidades, como el potencial de Coulomb de distribuciones de carga puntuales, lineales y superficiales. En cuanto a su ejemplo hipotético con la función delta de Dirac, no entiendo lo que quiere decir.
Bueno, vuelve a la mecánica y considera la ecuación. F = d tu / d X . si uno elige tu ser no diferenciable, F no se puede definir, entonces eso debe significar que las leyes de Newton son incorrectas, ¿verdad? Significa que no podemos predecir lo que sucederá en un sistema mecánico real. Pero este argumento no tiene sentido, porque no hay nada singular en lo que realmente está sucediendo. Siempre puedes elegir que tu descripción matemática sea peor de lo que tiene que ser, pero eso no me preocupa.
Obviamente, debes saber que las discontinuidades y singularidades en mi , B , j y ρ son todos físicamente inexistentes. En realidad todo está manchado. No tiene que usar objetos físicos singulares en electromagnetismo, y ciertamente no tiene que usar un potencial de calibre singular aquí, entonces, ¿por qué lo haría?
> "Si uno elige tu ser no diferenciable, F no se puede definir, así que eso debe significar que las leyes de Newton son incorrectas, ¿verdad?" No, significa que la función no es derivable y puede o no ser apropiada en el modelo. A veces, la singularidad en tu está bien, como la singularidad en la energía potencial gravitatoria newtoniana GRAMO metro 1 metro 2 / | r 1 r 2 | . > "Obviamente, debes saber que las discontinuidades y singularidades en mi , B , j y ρ son todos físicamente inexistentes. En realidad todo está manchado.” Nadie sabe eso a ciencia cierta.
> "Ciertamente no tienes que usar un potencial de calibre singular aquí, así que ¿por qué lo harías?" no tenemos que hacerlo, pero podemos , y cambia el resultado (valor de A d yo ). No existe una regla en la teoría EM, afaik, que prohíba los potenciales vectoriales que tienen singularidad en algún lugar fuera de la región de interés. En la región de interés - fuera del solenoide - A = 0 es un potencial vectorial perfectamente fino. Tal potencial tiene una singularidad dentro del solenoide, pero da un campo magnético correcto incluso allí.
¿Puede dar un ejemplo de un caso en el que elegir algo para que sea singular, cuando no tiene que serlo, alguna vez haya producido una predicción correcta y no trivial?
Quiero decir, estoy seguro de que puede elegir que el vector potencial sea singular. También puede elegir que tenga un valor de cuaterniones, o un valor de Grassmann, o un valor múltiple, o cualquier otro material matemático que desee agregar. Tal vez podría tomar la posición ultrafinitista y deshacerse de la línea real, por lo que la derivada no funciona Hay una cantidad infinita de complicaciones matemáticas adicionales que puede agregar. Las complicaciones que crees que son "naturales" son un fenómeno sociológico que se deriva de los problemas por los que los físicos matemáticos disfrutan preocupándose. Pero a la física real no le importa.
La motivación para un potencial con singularidad dentro del solenoide es que permite A = 0 fuera del solenoide, que es una solución bastante natural de la ecuación × A = 0 allá. Si puede encontrar valores de cuaterniones A eso da correctamente el campo magnético fuera y dentro del solenoide, creo que eso también sería válido.
> "¿Puede dar un ejemplo de un caso en el que elegir algo para que sea singular, cuando no tiene por qué serlo, haya producido alguna vez una predicción no trivial y correcta?" Sí, tratar los objetos físicos como partículas puntuales. Eso trae singularidad en el campo/interacción cuando las partículas se encuentran, pero permite modelos manejables que son útiles.
Creo que tenemos que estar de acuerdo en estar en desacuerdo, ya que ninguno de los dos va a convencer al otro. Todavía sostengo que la naturaleza no conoce ni se preocupa por ninguna de las sutilezas analítico-funcionales que los humanos han inventado. Sin embargo, entiendo cómo se podría pensar de otra manera.
En realidad, estoy de acuerdo en que a la naturaleza no le importan las matemáticas que los humanos hayan inventado. Es por eso que no me gusta la idea de que solo una elección particular de potencial (continuo, discontinuo), cuando no tiene impacto en los campos físicos, es "correcta". Pero bueno, dejemos esto por ahora.