¿Cuál es la ventaja de la transformación canónica al obtener el hamiltoniano efectivo?

Supongamos que tenemos hamiltoniano

H = H 0 + λ V

dónde H 0 es un hamiltoniano imperturbable del que conocemos los gustos propios, y V es una perturbación.

En el enfoque hamiltoniano efectivo usando la transformación canónica, transformamos el hamiltoniano vía

H mi F F = mi S H mi S

dónde S = S , entonces mi S es operador hermitiano, por lo que en realidad estamos haciendo una transformación unitaria de hamiltoniano. Luego expandiendo este término usando la identidad

mi S H mi S = H + [ S , H ] + 1 2 [ S , [ S , H ] ] + 1 3 ! [ S , [ S , [ S , H ] ] ] + . . .

obtenemos el hamiltoniano efectivo como

H mi F F = H 0 + λ V + [ S , H 0 ] + λ [ S , V ] + 1 2 [ S , [ S , H 0 ] ] + λ 1 2 [ S , [ S , V ] ] + . . .

Pero después de la transformación, el hamiltoniano anterior parece más complicado que el original. En este paso, no veo ninguna razón por la que hagamos la transformación canónica para obtener el hamiltoniano efectivo.

El libro dice que si podemos encontrar el operador S que satisface

λ V + [ S , H 0 ] = 0

entonces podemos eliminar los términos segundo y tercero del hamiltoniano efectivo, pero aún tenemos los términos de la serie infinita en el hamiltoniano, lo que aún parece complicado.

¿Cuál es el punto esencial de este enfoque de transformación canónica al obtener el hamiltoniano efectivo?

Existe otro método, que no involucra una transformación canónica, el método del operador de proyección de Feshbach, que conduce a un hamiltoniano efectivo. Se analiza en en.wikipedia.org/wiki/Feshbach%E2%80%93Fano_partitioning para una situación específica, pero su rango de aplicaciones es mucho más general. Básicamente se obtiene un resultado cerrado en un subespacio que está asociado con un operador de proyección dado PAG .

Respuestas (2)

Transformación canónica

Una transformación canónica del hamiltoniano viene dada por

H = mi S H mi S ,
con S anti-ermitano. La idea es eliminar ciertos términos en el hamiltoniano haciendo un cambio de base. Intercambiamos viejos grados de libertad por nuevos con la esperanza de que el nuevo hamiltoniano sea más fácil de resolver. La elección específica de S depende de la aplicación. La transformación canónica con
[ S , H 0 ] = λ V ,
se llama transformación de Schrieffer-Wolff . Más aplicaciones se pueden encontrar aquí .

Transformación de Schrieffer-Wolff

La idea detrás de este esquema es facilitar la proyección del hamiltoniano en algún subespacio de baja energía hasta un orden específico en λ . Considere el caso donde el resultado de primer orden es cero:

H mi F F = PAG gramo H 0 PAG gramo + PAG gramo V PAG gramo = mi gramo PAG gramo ,
dónde PAG gramo es el operador de proyección sobre el estado fundamental (degenerado) del sistema no perturbado. Un ejemplo es el mecanismo de superintercambio de Anderson para el modelo de Hubbard en el límite de salto de sitio débil. En este modelo, la tunelización entre sitios solo ocurre a través de procesos virtuales de orden superior.

Entonces queremos eliminar λ V del hamiloniano, que dará una representación donde los procesos de orden superior se manifiestan en el hamiltoniano. Para realizar un mejor seguimiento del pedido en λ , nosotros tomamos H = mi λ S H mi λ S . Por elección S de modo que [ S , H 0 ] = V , puede deshacerse de todos los términos en primer orden en λ en el hamiltoniano transformado:

H = H 0 + λ 2 2 [ V , S ] + O ( λ 3 ) .
Cada término en H excepto por H 0 representa un proceso de orden superior. Hasta segundo orden, el hamiltoniano efectivo se convierte en
H mi F F = PAG gramo H PAG gramo = mi gramo PAG gramo + λ 2 2 PAG gramo [ V , S ] PAG gramo .

Ejemplo

Como ejemplo, considere un estado fundamental degenerado con mi gramo = 0 y deja PAG mi ser la proyección sobre un subespacio excitado con energía imperturbable mi mi . Además, suponga que V solo conecta elementos fuera de la diagonal entre el estado fundamental y este estado excitado:

V = PAG gramo V PAG mi + PAG mi V PAG gramo .
ahora toma
S = PAG gramo V PAG mi PAG mi V PAG gramo mi mi .
y tenga en cuenta que S = S y eso
[ S , H 0 ] = 1 mi mi [ PAG gramo V PAG mi PAG mi V PAG gramo , H 0 ] = PAG gramo V PAG mi + PAG mi V PAG gramo = V .
El hamiltoniano transformado se convierte en
H = H 0 + λ 2 2 mi mi [ V , PAG gramo V PAG mi PAG mi V PAG gramo ] = H 0 + λ 2 mi mi ( PAG mi V PAG gramo V PAG mi PAG gramo V PAG mi V PAG gramo ) .
Nótese la interpretación de ambos términos de segundo orden. El término PAG gramo V PAG mi V PAG gramo representa un proceso de tunelización de dos pasos desde el estado fundamental hasta un estado excitado y viceversa. El hamiltoniano efectivo de baja energía se convierte en
H mi F F = PAG gramo H PAG gramo = λ 2 mi mi PAG gramo V PAG mi V PAG gramo .
En el modelo de superintercambio de Anderson que mencioné antes, este hamiltoniano efectivo representa una interacción de intercambio antiferromagnético.

¿Cuál es la diferencia entre la teoría de la perturbación estándar (cálculo de la energía y las funciones de onda de primer y segundo orden, tratadas en el libro QM estándar) y este enfoque de perturbación efectivo? Si descartamos los términos de orden superior en el hamiltoniano efectivo, ¿no es el mismo procedimiento que calcular la energía de primer o segundo orden en la teoría de perturbaciones? En realidad, estaba leyendo libros sobre el enlace de magnetismo frustrado . Este capítulo presenta un enfoque hamiltoniano efectivo para resolver el estado fundamental altamente degenerado.
@ user42298 No hay diferencia en mi humilde opinión. Es solo un truco conveniente. Como hablas de hamiltoniano efectivo, asumí algún tipo de enfoque perturbativo. Además, el hamiltoniano transformado H es equivalente al original, así que no entiendo por qué lo llamarías efectivo. Se vuelve efectivo solo cuando lo proyecta en el estado fundamental o lo restringe al estado fundamental. Si hay una corrección de primer orden, el hamiltoniano efectivo es simplemente mi 0 PAG gramo + λ PAG gramo V PAG gramo que es el resultado de la teoría de perturbaciones degeneradas de primer orden.
@ user42298 He encontrado una aplicación no perturbadora de la transformación canónica. La idea es deshacerse de un término específico y luego devolver el hamiltoniano a una forma cerrada.
Entonces estás diciendo que la transformación canónica en sí es lo mismo que el hamiltoniano original, ya que es solo una transformación unitaria. Si lo proyectamos en el subespacio del estado fundamental o cortamos los términos de orden superior, entonces se vuelve hamiltoniano efectivo. En general, el hamiltoniano transformado involucra componentes fuera de la diagonal, por lo que describir el estado fundamental utilizando solo el hamiltoniano efectivo no es exacto. Pero si una transformación hace que la forma diagonal del bloque o los componentes fuera de la diagonal para el subespacio del estado fundamental resulte ser pequeña, podemos describir fácilmente el estado fundamental utilizando menos bases.

Tal como está, el hamiltoniano efectivo contiene la misma información que el original. Pero tenga en cuenta que, dada la condición λ V + [ S , H ] = 0 , S es proporcional a λ por lo que los términos restantes son de orden λ 2 y más alto. Por lo tanto, el truncamiento al omitir estos términos da un resultado correcto a la orden λ . Supongo que esta es la motivación detrás del procedimiento. ¿El libro no dice nada sobre esto?

Creo que tu respuesta es correcta. La introducción de este capítulo dice "transformando algunos grados de libertad, y generando una interacción efectiva entre los restantes". Para resolver exactamente el hamiltoniano, tenemos que buscar en todo el espacio de Hilbert. Pero mediante este tipo de transformación, al menos podemos eliminar el término de primer orden, por lo que no necesitamos buscar en ese espacio. Además, si truncamos los términos de orden superior del hamiltoniano efectivo, podemos reducir notablemente el espacio de hilbert nuevamente. Creo que este tipo de reducción es la esencia de la transformación canónica.
@ user42298 ¿Por qué querría deshacerse del término más significativo en la perturbación si no es cero? Para mí, esto tiene sentido solo cuando el resultado de primer orden se desvanece. ¿Es posible este procedimiento si su subespacio no perturbado tiene una corrección perturbativa de primer orden?