¿Por qué todavía usamos la teoría de la perturbación, cuando tenemos métodos numéricos avanzados y computadoras rápidas?

Si mi pregunta suena ignorante o incluso insultante, me disculpo. Puedo estar completamente equivocado, ya que no soy un físico teórico.

Entonces, entiendo por qué la teoría de la perturbación se usó originalmente en la mecánica cuántica e incluso antes en otros campos. Simplemente no había mejores formas de resolver algunos problemas (al menos aproximadamente). Y es un gran método para algunos problemas con perturbaciones 'pequeñas'.

Pero ahora tenemos computadoras rápidas y métodos numéricos avanzados. Pero no solo los investigadores todavía usan PT para problemas particulares, sino que gran parte del trabajo teórico en mecánica cuántica todavía se basa en PT de primer orden (o de segundo orden en el mejor de los casos). Tomemos como ejemplo la regla de oro de Fermi.

Pero PT (primer o segundo orden, que se utilizan) no siempre da una buena aproximación, e incluso escuché que su convergencia no ha sido probada en general.

Entonces, por favor, dígame, ¿se está trabajando en ir más allá del PT en el cuerpo teórico de la mecánica cuántica, la física del estado sólido y otros campos? ¿O tal vez, hay algún PT avanzado con términos de orden superior que se adapta mejor a las implementaciones informáticas?

Las computadoras hacen lo que les dices que hagan (en un tiempo más rápido que los humanos). La teoría de la perturbación existe para todos aquellos hamiltonianos cuyas ecuaciones de movimiento no pueden resolverse explícitamente (y, por lo tanto, implementarse numéricamente); para ellos, los únicos métodos computacionales inventados hasta ahora son las expansiones de Taylor. Aparte de eso, nada prohíbe realmente que alguien implemente numéricamente algo de cualquier tipo, si pudiera hacerlo (y la gente realmente lo hace, por ejemplo, con cálculos numéricos de diagramas de Feynman en casi cualquier orden).
En campos como la relatividad numérica, la teoría de la perturbación (o una aproximación posnewtoniana) se utiliza a menudo para comprobar las simulaciones numéricas. Creo que esta es una excelente razón para hacer teoría de perturbaciones. Puede ser un punto de referencia para asegurarse de que está resolviendo el problema correctamente en una computadora.
Para agregar a los comentarios anteriores: a menudo es más fácil interpretar ecuaciones que interpretar los resultados de simulaciones numéricas. La teoría de la perturbación nos permite generar ecuaciones más simples que pueden usarse para interpretar los resultados numéricos.
@GennaroTedesco, no puedo imaginar un problema para el cual la expansión de Taylor sea el único método. Mi punto era exactamente que para la mayoría de los problemas, simplemente tomar el primer y segundo término de Taylors no es la forma más efectiva. Especialmente para el desarrollo de la teoría general QM. Es como una aproximación lineal o cuadrática que todavía se usa ampliamente en física, a pesar de su inexactitud.
@YuriyS Estoy de acuerdo en que no es el más efectivo: ¿tiene ejemplos en los que se prefieren otros métodos (personalmente no) y más fáciles de implementar numéricamente?
@GennaroTedesco, no soy un especialista, pero la diferencia finita, el elemento finito o varios métodos galerkin son relativamente fáciles de implementar con el software moderno. Estoy absolutamente de acuerdo en que, para muchos problemas, el PT es la mejor manera, si el rango de aplicabilidad está bien definido. Pero los resultados de todos los cálculos de PT deben verificarse mediante otros métodos.

Respuestas (3)

Pero ahora tenemos computadoras rápidas y métodos numéricos avanzados. Pero no solo los investigadores todavía usan PT para problemas particulares, sino que gran parte del trabajo teórico en mecánica cuántica todavía se basa en PT de primer orden (o de segundo orden en el mejor de los casos).

La razón por la que no se ha abandonado la teoría de perturbaciones es la complejidad computacional. Este campo (CC) es el estudio de cómo crece el tiempo necesario para obtener una solución a medida que aumenta el tamaño (N) del problema (por ejemplo, aumentando el número de puntos de la cuadrícula en una integración numérica). Hay dos categorías principales de CC: 1) aquellas en las que el tiempo aumenta como un polinomio de N (denominado tipo P) y 2) aquellas en las que el tiempo aumenta exponencialmente (denominado EXPTIME).

Podría escribir la ecuación de Schrödinger exacta para un átomo de N electrones, pero a menos que N = 1 (hidrógeno, donde es posible una solución analítica), el problema es del tipo EXPTIME y los intentos de obtener soluciones numéricas para la ecuación exacta seguirán siendo poco prácticos sin importar lo rápidas que se vuelven las computadoras. El crecimiento exponencial en el tiempo pronto supera cualquier aumento en los recursos.

Esto no significa que la teoría de la perturbación simple de primer o segundo orden sea la única alternativa. Para el átomo de electrones N, por ejemplo, generalmente se asume un conjunto de orbitales similares al hidrógeno (generados a través de algún potencial central V(r)) y se escribe el valor esperado del hamiltoniano exacto para un determinante de Slater de estos orbitales. Este es en realidad un resultado de la teoría de perturbaciones de primer orden donde el potencial perturbador es la diferencia entre el hamiltoniano completo y el hamiltoniano que incluye el campo central V(r) pero excluye los términos de interacción electrón-electrón.

Sin embargo, no nos detenemos en este resultado de primer orden. Al igualar la derivada variacional de este valor esperado con respecto a cada orbital a cero, obtenemos las ecuaciones de Hartree-Fock (HF) (convirtiendo así un problema EXPTIME en un problema P). Resolviendo iterativamente las ecuaciones de HF hasta que el potencial central V(r) obtenido de los orbitales genere exactamente los mismos orbitales en la siguiente iteración (una condición llamada autoconsistencia), efectivamente sumamos cierto subconjunto de términos de la teoría de la perturbación a un orden infinito y obtenemos aproximaciones bastante buenas para el problema de N-electrones. La teoría de la perturbación simple es el punto de partida, pero el resultado final va mucho más allá.

Es cierto que no existe una prueba general de la convergencia de los enfoques de la teoría de la perturbación y hay algunos ejemplos en los que se puede demostrar explícitamente la no convergencia, pero muchos problemas en física simplemente no se pueden abordar de otra manera.

Después de usar métodos numéricos para problemas reales de QM, aprecio mucho mejor la verdad de esta respuesta. Realmente no es posible dar un tratamiento numérico completo a la mayoría de los problemas con los recursos computacionales existentes.

Por la misma razón todavía usamos 1 + X ( 1 + 1 2 X ) : porque en muchas circunstancias uno no está muy interesado en una larga serie de decimales sino que busca comprender aspectos más cualitativos de la respuesta.

La teoría de la perturbación para los valores propios/vectores propios es una especie de versión sofisticada de una expansión en serie, ya que se obtienen valores propios y vectores propios como una serie en las potencias de la perturbación.

Tanto en el sentido de que, en un número muy elevado de casos, basta con utilizar 2 1.41 o incluso 2 1.4 , rara vez hay algo fascinante con la teoría de perturbaciones más allá del segundo orden (hay excepciones). [Aparte, a menudo ocurren problemas interesantes cuando la teoría de la perturbación no es aplicable.]

Si su espacio de Hilbert es grande, digamos 10 6 con el propósito de argumentar, aunque esto no es particularmente grande, entonces la computadora escupirá 10 6 vectores propios; cada uno de estos vectores propios tiene 10 6 componentes, la mayoría de los cuales serán muy pequeños (de lo contrario, no es una perturbación). Si un estado base particular entra en el vector propio exacto con probabilidad 10 10 , es probable que este estado no sea muy importante para comprender las propiedades del vector propio: su computadora se habrá esclavizado para producir 10 6 autovectores complicados, para los cuales la mayoría de los componentes son de poco interés. Si cambia la fuerza de la perturbación solo un poco, debe rehacer el cálculo para obtener un conjunto completamente nuevo de vectores propios, que no diferirá mucho del cálculo anterior.

Con la teoría de la perturbación, por otro lado, el parámetro perturbativo es explícito, por lo que puede evaluar fácilmente cómo cambiarán las cosas a medida que cambie este parámetro. Básicamente, no necesita rehacer el cálculo si quiere saber 9.1 3.017 , 9.2 3.033 o 9.3 3.050 : puedes ver cómo cambian las cosas usando

9 + ϵ 3 ( 1 + ϵ 18 ) .
Si necesita una respuesta numéricamente más precisa, siempre puede incluir el término en ϵ 2 . Solo si realmente necesita precisión, usaría una calculadora.

Para muchas aplicaciones, la teoría de la perturbación de primer (a veces segundo) orden brinda una descripción adecuada en forma analítica, que puede ser más adecuada para investigaciones posteriores que para la recopilación de datos.

Después de todo, el objetivo de dichos cálculos es probar la validez del modelo físico específico en cuestión, proporcionando los valores de ciertos observables físicos. A veces, buscar una solución numérica sería excesivo, otras veces proporcionar un tratamiento analítico en términos de la teoría de la perturbación enfatizaría las limitaciones u otras características importantes de la teoría.

El área de efectos no lineales no se trata de la misma manera, porque el resultado lineal no describiría los fenómenos. Desafortunadamente, esto no significa que los números darán la cura. Incluso si uno obtiene datos numéricos, a veces es difícil sacar conclusiones solo a partir de ellos.