¿Por qué funciona la teoría de la perturbación renormalizada?

He leído sobre la renormalización de ϕ 4 teoría, es decir. L = 1 2 m ϕ m ϕ metro 2 ϕ 2 λ 4 ! ϕ 4 , particularmente del libro de Ryder. Pero estoy confundido acerca de algo:

Ryder comienza calculando la función de Green de dos puntos GRAMO ( X , y ) ordenar O ( λ 2 ) (es decir, la corrección de primer orden al propagador libre). ahora si tomamos λ ser pequeño entonces esto debería ser una buena aproximación, pero GRAMO ( X , y ) diverge, por lo que lo regulariza imponiendo un límite de impulso Λ , y luego hace metro una función de Λ , es decir. metro = metro ( Λ ) . Luego pasa a lo mismo para la función de Green de cuatro puntos, y encuentra que λ es también una función del corte, es decir. λ = λ ( Λ ) . Pero en este punto λ ( Λ ) ya no es pequeño cuando Λ es grande (en particular λ como Λ ), entonces, ¿qué hace que la serie de perturbaciones sea válida? ¿Cómo podemos ignorar la O ( λ 2 ) ¿términos? He leído cosas como "renormalizado hasta 1 bucle", pero ¿qué pasa con todos los demás bucles, son pequeños? ¿O estoy malinterpretando lo que está pasando?

Tal vez sea así: cuando calculamos la función de Green de dos puntos G(x,y) después de hacer un corte de cantidad de movimiento en algún punto grande Λ > Λ 0 , dónde Λ 0 es mayor que el momento en el que estamos realizando el experimento, encontramos que la masa se ha desplazado a la masa física metro PAGS = metro + λ metro ( 1 ) ( Λ 0 ) + O ( λ 2 ) , dónde metro ( 1 ) ( Λ ) es un término de corrección de primer orden. Ahora tenemos una segunda ecuación para λ dado por alguna función λ ( Λ ) que va al infinito como Λ , pero λ ( Λ 0 ) < 1 . Entonces podemos ignorar la O ( λ 2 ) termino y solo di metro PAGS = metro + λ metro ( 1 ) ( Λ 0 ) . Ahora que la física de baja energía debería ser independiente de la escala de energía y Λ 0 ya es grande, suponemos metro PAGS tiene la misma forma en todas las escalas de energía Λ y esto define metro una funciones de Λ , asi que metro PAGS = metro ( Λ ) + λ ( Λ ) metro ( 1 ) ( Λ ) , y luego para cada cálculo que hacemos para pedir uno en λ sustituimos en esta fórmula por metro PAGS tomar Λ y calcular los resultados. Ahora técnicamente una mejor aproximación a metro PAGS en el punto de corte es metro PAGS = metro + λ metro ( 1 ) ( Λ 0 ) + λ 2 metro ( 2 ) ( Λ 0 ) , y entonces, si queremos un mejor resultado, debemos establecer metro PAGS = metro ( Λ ) + λ ( Λ ) metro ( 1 ) ( Λ ) + λ 2 ( Λ ) metro ( 2 ) ( Λ ) y hacer lo mismo. ¿Es algo como esto?

Respuestas (6)

La renormalización siempre es necesaria cuando el hamiltoniano es singular. Singular significa que la expresión formal del hamiltoniano resultante de la interacción especificada no es un operador autoadjunto en un dominio denso. Entonces la dinámica está mal definida formalmente y debe ser renormalizada cuidando representar todo correctamente como un límite que tenga sentido.

En particular, este es siempre el caso en las teorías de campos cuánticos relativistas que interactúan en 3 o 4 dimensiones del espacio-tiempo.

Para comprender por qué y cómo funciona la renormalización, primero se pueden considerar situaciones más simples en la mecánica cuántica. En este caso, hay modelos de juguete explícitamente resolubles (perturbaciones singulares de bajo rango de sistemas resolubles simples) donde uno puede ver exactamente qué sucede y por qué. Consulte mi artículo Renormalización sin infinitos: un tutorial , que analiza esto en detalle.

Acerca de cómo (o si) uno puede saber si los términos en una serie asintótica serán pequeños, consulte las discusiones en el Capítulo B5: Divergencias y renormalización de mis preguntas frecuentes sobre física teórica .

¿Qué significa 'singular' en este contexto? PD. Aprecié mucho su artículo, siento que ayudó mucho a mi comprensión.
@RobinEkman: Singular significa que la expresión formal del hamiltoniano resultante de la interacción especificada no es un operador autoadjunto en un dominio denso. Por lo tanto, la dinámica está mal definida formalmente y debe renormalizarse teniendo cuidado de representar todo correctamente como un límite que tenga sentido.

Antes de intentar responder a tu pregunta, una cosa:

¿Ryder realmente calcula el O ( λ 2 ) al propagador como la primera contribución en la teoría de la perturbación, porque en realidad hay un O ( λ 1 ) al propagador y al O ( λ 2 ) -loop es, en lo que a mí respecta, un diagrama de dos bucles, es decir, que tiene dos impulsos de bucle, lo que en realidad es difícil de resolver como primer ejemplo para introducir el procedimiento de renormalización. Pero para ser honesto, esto O ( λ 1 ) -La contribución no conduce a ninguna renormalización de la masa, por lo que no aprenderá mucho de esto, pero no estoy seguro de si Ryder lo menciona.

Pero déjame intentar responder a tu pregunta con un punto de vista ligeramente diferente:

Lo que pasa con la renormalización es que ves que las integrales de tu bucle divergen, por lo que impones un corte de impulso Λ , con la motivación en mente, que la teoría tiene sólo un rango limitado de validez. Y como ya mencionaste, el resultado dependerá de este límite, por lo que "ocultas" la dependencia del límite en la redefinición de los parámetros (masas y acoplamientos) de tu teoría. El argumento es que los parámetros que escribes en el Lagrangiano (digamos, λ 0 y metro 0 ) no tienen significado físico, pero los parámetros que mides por experimento ( λ y metro ) tienen y se desplazan. Entonces, hasta este punto, es correcto decir que los parámetros dependen del corte, pero el problema que mencionas no surge.

Permítanme señalar esto en el siguiente ejemplo: Para el ϕ -propagator (la función de Green) obtienes alguna modificación debido a la integral de bucle Π ( pags 2 ; Λ ) :

i pags 2 metro 2 + i ϵ i pags 2 metro 2 Π ( pags 2 ; Λ ) + i ϵ
donde se puede interpretar el término metro 2 + Π ( pags 2 ; Λ ) como el efectivo metro mi F F 2 del propagador. (La forma del propagador, incluidos los bucles, es más o menos una serie geométrica de propagadores libres e inserciones de lopp) Para continuar, ahora es necesario declarar cómo define su parámetro (en este caso, la masa metro ) imponiendo una determinada condición de renormalización. Entonces, por ejemplo, una opción particular es que dices que para pags 2 = metro 2 metro mi F F 2 = metro 2 o Π ( pags 2 = metro 2 ; Λ ) = 0 . Pero incluso en este caso verás un Λ -término dependiente en Π ( pags 2 ; Λ ) Para deshacerse de esto, redefina la integral de bucle como
Π ( pags 2 ; Λ ) Π ¯ ( pags 2 ) = límite Λ ( Π ( pags 2 ; Λ ) Π ( pags 2 = metro 2 ; Λ ) )

El límite Λ se puede hacer, porque se resta más o menos la parte divergente de la integral de bucle. Y ese es el punto importante: no solo dice que redefine sus parámetros en función del límite, sino que también impone una condición de renormalización que al final conduce a una Λ -Cantidad independiente.

Oh, quise decir que calcula solo un ciclo y absorbe todo lo demás en O ( λ 2 ) . Sin embargo, todavía estoy confundido acerca de por qué debería funcionar la aproximación: para mí, parece que tenemos una serie de perturbaciones de F ( metro , λ ) Σ norte λ norte a norte ( metro ) y estamos enviando λ hasta el infinito. Esta enviando metro , λ en la forma en que se hace equivalente a escribirlo como una serie de perturbaciones en las variables físicas metro física , λ física , es decir. es como límite metro , λ F ( metro , λ ) norte λ física norte a norte ( metro física ) ?
Sí, la renormalización es un tema muy confuso. Yo personalmente no me llamaré un experto en esto y entiendo que este procedimiento de regular las integrales y renormalizar las cantidades medibles, de modo que la dependencia del regulador se desvanece, parece como esconder muchos términos divergentes debajo de la alfombra y esperar que nadie sabrá. Pero déjame ponerlo de esta manera, supongamos que las integrales de bucle tienen la forma: término regular para p + término divergente (que está regulado). lo que haces entonces es restar el término divergente como señalé anteriormente con la redefinición de la integral de bucle.
No sé cuánto lees sobre la teoría de la perturbación renormalizada, pero generalmente se introducen los llamados contratérminos, es decir, reformulas el Lagrangiano 'cambiando' de los parámetros desnudos a los verdaderos y estos términos adicionales pueden interpretarse como interacciones y reglas adicionales de Feynman. Y cuando escribe un proceso en particular, también debe incluir los contratérminos. Pero el "acoplamiento" de estos contratérminos está fijado por su condición de renormalización. Esto se hace, por ejemplo, en 10.2 de Peskin & Schroeder. Tal vez en este marco no tengas esta confusión.

Muchas dificultades en la renormalización se aclaran cuando se usa el punto de vista de "Reparametrización de la teoría".

Permítanme ilustrar lo que quiero decir:

Si uno obtiene ingenuamente una teoría cuántica de campos a partir de una teoría clásica de campos mediante un procedimiento de cuantización, obtiene resultados poco realistas para cantidades medibles. Esto no debería sorprender: ¿Por qué los parámetros clásicos de nuestra teoría deberían ser los correctos para nuestra teoría cuántica de campos?

Así que queremos repararmetrizar nuestra teoría, de modo que los nuevos parámetros finitos den resultados realistas.

Considere una densidad lagrangiana L = 1 2 A m ϕ m ϕ + 1 2 B 2 ϕ 2 + 1 4 ! C ϕ 4 .

Ahora las cantidades medibles de la teoría cuántica de campos correspondiente dependerán de esos parámetros, por ejemplo

  • "masa física" = polo del propagador = P(A,B,C)

  • "Renormalización de la función de onda" = Residuo del propagador = Z(A,B,C)

  • "Vértice de 4 puntos en ciertos mandelstams" = G(A,B,C)

Ahora queremos invertir esas funciones para obtener una nueva parametrización A(P,Z,G), B(P,Z,G), C(P,Z,G). Dado que P, Z, G son medibles en el experimento, deberían ser finitos y una buena parametrización de nuestra teoría cuántica de campos.

Ahora, primero considere un contexto no perturbativo: aquí deberíamos poder invertir P, Z, G exactamente para obtener una reparametrización en la que nuestras cantidades medibles sean, con suerte, finitas.

En un contexto perturbativo podemos calcular P,Z,G hasta el orden, digamos, N. Entonces las "Condiciones de Renormalización" (que son más "Condiciones de Reparametrización") definen una reparametrización diferente para cada orden N. Si renormalizamos hasta orden N, entonces hemos elegido una reparametrización que hace que todo sea finito hasta el orden N. Tal vez esta reparametrización también haga que las cosas sean finitas en orden superior, pero tal vez no.

Nota Bene: Cosas como MS o MS-bar simplemente definen diferentes condiciones de renormalización/reparametrización, es decir, implícitamente a través de contratérminos, ya que cada esquema de sustracción determina la estructura de los contratérminos y la estructura de los contratérminos determina la reparametrización.

PD: En la nomenclatura anterior normalmente se elige la condición de Reparametrización Z(A,B,C) = 1.

PPS: Esta publicación es más una ilustración que una argumentación rigurosa real. Pero todo lo que dije se puede hacer más riguroso.

El truco está en la introducción de una escala de renormalización.

Una vez que se ha regularizado la teoría de la perturbación, se obtiene una interacción dependiente del impulso (y del corte) de la forma (esquemática) en 4D

λ ( pags ) = λ 0 + α λ 0 2 en ( Λ 2 / pags 2 ) ,
dónde λ 0 es la interacción pura, y α algunos factores numéricos.

Lo que se hace es fijar el valor de la interacción en una energía dada pags 2 = m 2 , tal que λ ( m ) 1 . expresando λ ( pags ) en términos de λ ( m ) Se obtiene

λ ( pags ) = λ ( m ) + α λ ( m ) 2 en ( m 2 / pags 2 ) ,
que es de hecho una buena teoría de la perturbación.

Tenga en cuenta que esta teoría de la perturbación funciona bien solo para energías lo suficientemente cercanas a m , y que el punto de referencia λ ( m ) debe ser dado por los experimentos, o una teoría más fundamental.

Ok, seguiré leyendo sobre eso. Supongo que tal vez estoy confundido acerca de cómo lo sabe, al hacer una predicción en qué orden debe calcular la serie de perturbaciones, y si agregar más términos hace que el valor de la serie truncada sea significativamente diferente.
@JLA: desde la expansión de la perturbación en términos de λ ( m ) está bien (por pags cerca de m ), agregar más términos no cambiará mucho. Sin embargo, se pueden resumir los logaritmos, para mejorar la serie, usando ecuaciones tipo RG.

Quisiera subrayar la diferencia entre

1) Renormalización perturbativa

2) Renormalización no perturbativa

Por Renormalización Perturbativa me refiero a eliminar infinitos del cálculo de un correlador/amplitud, orden por orden . Esto se hace introduciendo contratérminos, es decir, reescribiendo los parámetros desnudos del lagrangiano como λ B a r mi = λ o b s + d λ , eligiendo un esquema de regularización con su escala de "corte" Λ , e imponiendo el valor de un (posible número finito de) correladores/amplitudes. Tienes que medir realmente estos valores para establecerlos; no puedes calcularlos a partir de la teoría. En función de estos parámetros, se puede calcular cualquier otro correlador/amplitud obteniendo un resultado finito, por muy alto que sea el orden al que se llegue.

Por qué esto funciona puede interpretarse con un análisis esquemático complicado o con un enfoque de corte flotante, a la Wilson.

Ahora pasemos al segundo punto.

Una vez que resolvió el primer problema (haciendo finitas las cantidades orden por orden), y comienza a calcular los correladores/amplitudes, descubre que los resultados (ahora finitos) involucran "grandes logaritmos" como yo o gramo ( metro / metro 0 ) dónde metro 0 es la escala de renormalización, es decir, la escala típica de las cantidades que mide e impone que podrían ser, por ejemplo, correladores/amplitudes que involucran campos/partículas con una escala de energía común similar, y metro es la escala típica del correlador/amplitud que desea calcular. Esto es un problema porque, incluso si las cantidades que está calculando son finitas en cada orden, no puede descuidar órdenes más altas que involucran más y más de estos "logaritmos grandes".

La solución a este problema es suavizar el paso de la escala de renormalización a la escala de interés, es decir pasar de metro 0 a una escala metro 0 = metro 0 + d metro (ahora los logaritmos son pequeños), y de aquí a metro 0 + d metro y así sucesivamente hasta llegar a metro . Este procedimiento de "suavizado" es el Flujo de Grupo de Renormalización, y puede pensarse como una expansión de los correladores/amplitudes no en términos de λ B a r mi o λ o b s sino más bien de acoplar constantes que dependen (o corren) de la escala metro de los observables que desea calcular.

Ahora, si esta ejecución es tal que las constantes de acoplamiento permanecen pequeñas, entonces la expansión perturbativa seguirá siendo válida y, por lo tanto, se mantiene la "renormalización perturbativa", de lo contrario, se debe diseñar otra técnica para producir previsiones cuantitativas de su teoría.

Para comprender por qué la renormalización puede funcionar, primero puede considerar situaciones más simples en Mecánica Clásica/Cuántica. En este caso, hay modelos de juguetes explícitamente solucionables donde uno puede ver exactamente qué sucede y por qué. Consulte mi artículo " Un modelo de juguete de renormalización y reformulación " en arXiv.

Acerca de cómo hacer frente a los términos crecientes, consulte mi breve nota aquí .