¿Cuál es el significado físico de la afirmación de que "los fotones no tienen posiciones"?

Se ha mencionado en otra parte de este sitio que no se puede definir un operador de posición para el sector de un fotón del campo electromagnético cuantificado, si se requiere que el operador de posición tenga ciertas propiedades formales. Este es un teorema que se cumple solo para partículas sin masa de helicidad. | λ | 1 , en particular, no se aplica a escalares sin masa.

Mucha gente, en particular los físicos matemáticos o los libros de texto de teoría cuántica de campos más antiguos, parecen interpretar que esto significa que nunca debemos hablar de la posición de nada en la teoría cuántica de campos relativista. Pero todavía parece posible decir algo sobre dónde está un fotón. Por ejemplo, si tengo una cavidad ideal y excito el modo más bajo con un fotón, sé que el fotón está en esa cavidad. Además, puedo localizar el fotón arbitrariamente bien utilizando cavidades cada vez más pequeñas.

Cuando se realiza un experimento de óptica utilizando un rayo láser, es perfectamente significativo hablar de fotones en el rayo. También podemos hablar de un fotón emitido por un átomo, en cuyo caso obviamente está localizado cerca del átomo cuando ocurre la emisión. Además, en el análisis habitual del experimento de la doble rendija se tiene, al menos implícitamente, una función de onda para el fotón, que recupera con éxito el resultado de la escuela secundaria.

Cuando se habla de experimentos de dispersión, como la dispersión fotón-fotón, hay que hablar de paquetes de ondas localizados para describir un haz real. Además, a diferencia del caso masivo, donde la longitud de onda de Compton proporciona una longitud característica, no existe una longitud característica para los fotones, lo que sugiere que, en principio, los haces pueden hacerse arbitrariamente estrechos: la queja de que comenzaría a causar la producción de pares por debajo de la longitud de onda de Compton no aplicar

En otras palabras, si bien el teorema es hermético, no parece imponer ninguna limitación práctica sobre las cosas que realmente nos gustaría hacer experimentalmente. Pero puedes encontrar descripciones que suenan muy extrañas de lo que este teorema nos dice en línea. Por ejemplo, en PhysicsForums puede leer muchas declaraciones obviamente incorrectas (por ejemplo, aquí y aquí y aquí ) como:

El fotón no tiene marco de reposo. Calcular una expectativa de posición para tal objeto no tiene sentido.

¡Una buena razón es que los fotones no tienen masa y se mueven a la velocidad de la luz y no tienen marco de reposo! Entonces también son bosones, así que no puedes decir cuáles son cuáles.

Estos son incorrectos porque también se aplican a escalares sin masa, para los cuales existe un operador de posición (Newton-Wigner). Tampoco tiene sentido: si no puedes medir la posición de algo si no estás en su marco de reposo, ¿cómo puedo atrapar una pelota?

En la teoría relativista cuántica (de campo) no existe el concepto de fotones individuales.

No puede definir la "posición" para un campo electromagnético o de fotones, que son ciertos estados de este campo (es decir, estados de Fock de un solo fotón). A nadie que piense en las ondas electromagnéticas clásicas se le ocurriría preguntar cuál podría ser la posición de un campo.

Esto es incorrecto porque el sector de una partícula de una teoría cuántica de campos está perfectamente bien definido, y es perfectamente válido definir operadores que actúan solo sobre él.

Puede demostrarse que, en el contexto de la teoría cuántica relativista, el operador de posición conduce a violaciones de la causalidad.

Esto es bastante vago porque la teoría cuántica de campos es causal, por lo que no está claro cómo "el operador de posición" anula eso.

Podría ser que PhysicsForums sea un sitio de calidad excepcionalmente baja, pero creo que el verdadero problema es que interpretar este teorema es bastante complicado. ¿ Qué consecuencias físicas no triviales tiene la inexistencia de un operador formal de posición de fotones?

"Además, puedo localizar el fotón arbitrariamente bien usando cavidades cada vez más pequeñas", no particularmente, o al menos no 'ese' fotón (es decir, no sin cambiar su frecuencia. Puede intentar localizar más ajustado que la longitud de onda y obtener un ' modo confinado, pero al precio de tener la mayoría del poder (/población) en colas evanescentes.

Respuestas (7)

Podríamos pasar una eternidad jugando al whac-a-mole con todas las afirmaciones confusas/confusas que continúan apareciendo sobre este tema, en PhysicsForums y en otros lugares. En lugar de hacer eso, ofreceré una perspectiva general que, al menos para mí, ha sido refrescantemente clarificadora.

Comenzaré revisando un resultado general de rechazo, que se aplica a todas las QFT relativistas, no solo a los fotones. Luego explicaré cómo se respondería la pregunta análoga para los electrones , y finalmente extenderé la respuesta a los fotones. La razón para hacer esto en ese orden probablemente quedará clara en retrospectiva.

Un resultado general negativo

Primero, aquí hay una revisión del resultado fundamental de no-go para QFT relativista en el espacio-tiempo plano:

  • En QFT, los observables están asociados con regiones del espacio-tiempo (o simplemente espacio, en la imagen de Schrödinger). Esta asociación es parte de la definición de cualquier QFT dado.

  • En QFT relativista, el teorema de Reeh-Schlieder implica que un observable localizado en una región limitada del espacio-tiempo no puede aniquilar el estado de vacío. Intuitivamente, esto se debe a que el estado de vacío está entrelazado con respecto a la ubicación.

  • Las partículas se definen en relación con el estado de vacío. Por definición, el estado de vacío tiene cero partículas, por lo que el teorema de Reeh-Schlieder implica que no puede existir un observable que represente el número de partículas en una determinada región limitada del espacio-tiempo: si un observable se localiza en una región limitada del espacio-tiempo, entonces puede No siempre registra cero partículas en el estado de vacío.

Ese es el resultado negativo, y es muy general. No está restringido a partículas sin masa o a partículas de helicidad. 1 . Por ejemplo, también se aplica a los electrones. El resultado de no-go dice que no podemos satisfacer ambos requisitos: en QFT relativista, no podemos tener un detector que sea a la vez

  • perfectamente fiable,

  • localizado en una región estrictamente delimitada.

Pero aquí está la pregunta importante: ¿ qué tan cerca podemos llegar a satisfacer ambos requisitos?

Calentamiento: electrones

Primero considere la QFT de electrones que no interactúan, con Lagrangian L ψ ¯ ( i γ + metro ) ψ . La pregunta es sobre los fotones, y llegaré a eso, pero empecemos con los electrones porque entonces podemos usar la masa del electrón. metro para definir una escala de longitud / metro C con el que se pueden comparar otras cantidades.

Para construir observables que cuenten electrones, podemos usar los operadores de creación/aniquilación. Lo sabemos por QFT 101 cómo construir operadores de creación/aniquilación a partir de los operadores de campo de Dirac ψ ( X ) , y sabemos que esta relación no es local (y no localizable) debido a la función ω ( pag ) = ( pag 2 + metro 2 ) 1 / 2 en el integrando, como prometió Reeh-Schlieder.

Sin embargo, para electrones con un momento suficientemente bajo, esta función también podría ser ω metro . si reemplazamos ω metro en el integrando, entonces la relación entre los operadores de creación/aniquilación se vuelve local. Hacer este reemplazo cambia el modelo de relativista a no relativista, por lo que ya no se aplica el teorema de Reeh-Schlieder. Es por eso que podemos tener observables de conteo de electrones que satisfagan los dos requisitos anteriores en la aproximación no relativista.

Dicho de otra manera: se requiere que los observables asociados con regiones mutuamente similares al espacio se conmuten entre sí (el requisito de microcausalidad ). La escala de longitud / metro C es la escala en la que los conmutadores de nuestros observables detectores casi locales caen con una separación espacial creciente. Dado que las colas distintas de cero de esos conmutadores caen exponencialmente con longitud característica / metro C , no los notaremos en experimentos que tienen baja energía/baja resolución en comparación con / metro C .

En lugar de comprometer la localización estricta, podemos comprometer la confiabilidad estricta: podemos construir observables que estén localizados en una región estrictamente delimitada y que casi aniquilen el estado de vacío. Tal observable representa un detector que es ligeramente ruidoso. El ruido vuelve a ser insignificante para detectores de baja resolución, es decir, para detectores observables cuya región de localización es mucho más grande que la escala. / metro C .

Esta es la razón por la que funciona la mecánica cuántica no relativista de pocas partículas: para los electrones.

fotones

Ahora considere el QFT del campo electromagnético por sí mismo, al que llamaré QEM. Todos los observables en este modelo se pueden expresar en términos de los operadores de campo eléctrico y magnético, y nuevamente sabemos por QFT 101 cómo construir operadores de creación/aniquilación que definen lo que significa "fotón" en este modelo: son las partes de frecuencia positiva/negativa de los operadores de campo. Esta relación es manifiestamente no local. Podemos ver esto a partir de la expresión explícita, pero también podemos anticiparlo de manera más general: la definición de frecuencia positiva/negativa implica el pasado/futuro infinito, y gracias al principio de división de tiempo, esto implica el acceso a regiones espaciales arbitrariamente grandes.

En QEM, no existe una escala característica análoga a / metro C , porque metro = 0 . Las ideas utilizadas anteriormente para los electrones aún funcionan, excepto que las desviaciones de la localización y/o la confiabilidad no se reducen exponencialmente con ninguna escala característica. En su lugar, caen como una potencia de la distancia.

En lo que respecta a esta pregunta, esa es realmente la única diferencia entre el caso del electrón y el caso del fotón. Esa es una diferencia suficiente para evitar que construyamos un modelo para fotones que sea análogo a la mecánica cuántica no relativista para electrones, pero no es una diferencia suficiente para evitar que los observables de detección de fotones sean localizados y confiables para la mayoría de los propósitos prácticos. Cuanto más grande permitamos que sea su región de localización, más confiable (menos ruidoso) puede ser un detector de fotones. Nuestra definición de cuán bueno es lo suficientemente bueno debe basarse en otra cosaademás de QEM en sí, porque QEM no tiene ninguna escala de longitud característica propia. Eso no es un obstáculo para tener observables de fotones relativamente bien localizados en la práctica, porque hay más en el mundo real que QEM.

Operadores de posición

¿Qué es un operador de posición? Nada de lo que dije anteriormente se refiere a tal cosa. En cambio, todo lo que dije anteriormente se expresó en términos de observables que representan detectores (o contadores) de partículas. Lo hice porque el punto de partida era QFT relativista, y QFT se expresa en términos de observables que se localizan en regiones limitadas.

En realidad, QM no relativista también se puede expresar de esa manera. Comience con la formulación tradicional en términos del operador de posición X . (Consideraré solo una dimensión por simplicidad). Este operador único X es realmente solo una forma conveniente de empaquetar y etiquetar un grupo de operadores de proyección que se conmutan mutuamente, a saber, los operadores PAG ( R ) que proyectan una función de onda Ψ ( X ) en la parte con X R , cortando las piezas con X R . En lenguaje elegante, el álgebra conmutativa de von Neumann generada por X es lo mismo que el álgebra de von Neumann conmutativa generada por todos los PAG ( R ) s, así que aparte de cómo se etiquetan las cosas con "valores propios", ambos representan el mismo observable en lo que respecta a la regla de Born. Si observamos cómo QM no relativista se deriva de sus raíces relativistas, vemos que el PAG ( R ) s están localizados dentro de la región R según la definición de QFT de "localizado", al menos en la medida en que la aproximación no relativista sea válida. En este sentido, QM de una sola partícula no relativista se expresa, como QFT, en términos de observables asociados con regiones limitadas del espacio. La formulación tradicional de QM de una sola partícula oscurece esto.

Este es el punto: cuando hablamos de un operador de posición para un electrón en un modelo no relativista, implícitamente estamos hablando de los operadores de proyección PAG ( R ) , que están asociados con regiones limitadas del espacio. El operador de posición X es una buena forma de empaquetar todos esos operadores de proyección y etiquetarlos con una coordenada espacial conveniente, de modo que podamos usar estadísticas concisas como medias y desviaciones estándar, pero no puede tener X sin tener también los operadores de proyección PAG ( R ) , porque la existencia del primero implica la existencia del segundo (a través del teorema espectral o, a través de la fantasía del álgebra de von-Neumann que mencioné anteriormente).

Entonces... ¿puede un fotón tener un operador de posición? Si por operador de posición entendemos algo así como los operadores de proyección PAG ( R ) , que están (1) localizados en una región estrictamente delimitada y (2) estrictamente confiables como "detectores" de cosas en esa región, entonces la respuesta es no. Un fotón no puede tener un operador de posición por la misma razón que un fotón no puede tener una aproximación no relativista: para un fotón, no existe una escala de longitud característica análoga a / metro C con el que se puede comparar el tamaño de una región de localización, sin referirse a otra cosa que no sea el propio campo electromagnético. Lo que podemos hacer es usar los operadores habituales de creación/aniquilación de fotones para construir observables de detección/conteo de fotones que no están estrictamente localizados en ninguna región delimitada pero cuyas "colas" son insignificantes en comparación con cualquier otra cosa que nos interese (fuera de QEM) , si la región de cuasi-localización es lo suficientemente grande.

¿Qué es una consecuencia física?

¿Cuál es una consecuencia física de la inexistencia de un operador de posición estricto? Los detectores localizados reales son necesariamente ruidosos. Cuanto más localizados estén, más ruidosos deben ser. Reeh-Schlieder garantiza esto, tanto para electrones como para fotones, siendo la principal diferencia que para los electrones, el efecto disminuye exponencialmente a medida que aumenta el tamaño de la región de localización. Para los fotones, decrece solo como una potencia del tamaño.

¡Gracias por la respuesta! En realidad, esto parece contradecir algunas otras cosas de las que escuché: escuché que puede definir un operador de posición de Newton-Wigner para todas las partículas masivas y partículas sin masa de baja helicidad, el problema es solo el fotón. (En concreto, se define como i k en el sector de una partícula, donde la derivada está en el espacio de cantidad de movimiento. Para el fotón esto falla porque al aplicarlo se producen fotones longitudinales). Los autocontenedores son estados perfectamente localizados.
¿Qué diría sobre la construcción de dichos operadores de posición? No dudo de la validez de lo que está diciendo, pero significa que debe haber nociones ligeramente diferentes de "operador de posición" en juego aquí.
@knzhou Newton-Wigner definió su operador de posición solo para estados de 1 partícula. No lo ponen en el contexto de QFT, pero por la forma de sus estados, si ponemos su teoría de 1 partícula en QFT en lo que parece ser la forma obvia, no están estrictamente localizados de acuerdo con los observables locales de QFT: tienen colas. Esto es consistente con arxiv.org/abs/quant-ph/0007060 , que critica las variantes de la idea NW y concluye que sus observables "locales" no conmutan en una separación similar al espacio. Entonces tiene razón: NW logró estados localizados cambiando el significado de "localizado".
Solo quiero decir que creo que no tener un operador local que elimine el vacío es bastante intuitivo y sensato. Piense de esta manera: el estado de vacío | 0 significa que todo el Universo está vacío, ahora mismo. Para verificar tal hecho, necesitaría sentir todo el espacio para asegurarse de que esté libre de partículas "escondidas" en alguna parte. Matar el vacío con una operación local significa que de alguna manera ha podido descubrir qué está pasando incluso en los confines más impíos y lejanos del espacio solo con esa operación, algo que claramente contradice la transmisión de información.
límite en relatividad especial. En el mejor de los casos, solo puede, de hecho, dictaminar que es "bastante probable" que esté en un vacío por tal. Filosóficamente, es como "probar un negativo". Tienes que buscar en todas partes para hacerlo, y eso lleva una cantidad infinita de tiempo.
Pregunta/respuesta relacionada: physics.stackexchange.com/q/343516
Pensé en otra cosa ahora: ¿es razonable decir que el hecho de que un detector localizado siempre debe tener al menos una probabilidad de registrar la presencia de partículas cuando se aplica a un estado de vacío es una forma buena, clara y concisa de poner sentido riguroso a la noción de "partículas virtuales que entran y salen del vacío" que a menudo se discute en las presentaciones de ciencia pop de este tema?
@The_Sympathizer Pensamiento interesante. La redacción de "partículas virtuales que entran y salen del vacío" no es ideal, pero las palabras nunca son ideales. El tema de las partículas y los detectores en QFT relativista es rico y técnicamente desafiante, y si un poco de redacción no ideal puede ayudar a captar el interés de las personas el tiempo suficiente para motivar un estudio más profundo, entonces Misión cumplida. Estoy bastante seguro de que algunos de los libros que leí sobre física cuando era niño incluían algunas presentaciones no ideales e incluso engañosas, pero me inspiraron a aprender más, y ese era su verdadero propósito.
@Chiral Anomaly: Entonces, ¿podría considerarse esto como una buena manera de darle un sentido riguroso a esa frase no ideal?
@Chiral Anomaly: Además, también me pregunto sobre esto: ¿es posible reformular matemáticamente esto como que una partícula relativista de RQFT tiene una función de onda posicional? ψ X ( X ) , pero que esta función de onda ocupa un espacio funcional que está más restringido que el de NRQM en el sentido de que las funciones de onda posibles más localizadas son, por ejemplo, algo así como distribuciones gaussianas (para masivas) o de Cauchy (para no masivas) con dispersión mínima ? Tenga en cuenta que aún puede agregarlos y, por lo tanto, formar un espacio de Hilbert, pero la denotación de la base es diferente y
corresponde a lo que, en cierto sentido, podría llamarse una versión más fuerte del principio de incertidumbre de Heisenberg que se mantiene cuando ese Δ X está obligado a tener un valor mínimo estricto?
@The_Sympathizer No estoy seguro de dónde proviene realmente la frase pop-sci. Podría ser una alusión a la estructura de la teoría de perturbaciones (diagramas de Feynman), mientras que el fenómeno destacado en esta publicación no hace referencia a la teoría de perturbaciones. O tal vez esté aludiendo al hecho de que los observables locales necesariamente tienen una variación distinta de cero en el estado de vacío, que está más directamente relacionado con el fenómeno no perturbativo resaltado aquí, pero la única forma de medir realmente un observable es introducir un físico dispositivo de medición, y entonces el estado ya no es el estado de vacío.
@The_Sympathizer Con respecto a una interpretación alternativa donde Δ X tiene un valor mínimo estricto, tal vez haya algo de eso, pero no sé de antemano cómo hacerlo riguroso. Si X está destinado a corresponder a la posición de una partícula, con Δ X siendo un límite inferior estricto sobre qué tan bien definido puede estar, entonces supongo que el primer paso para hacer esto riguroso sería considerar solo los observables que preservan el subespacio de una sola partícula y luego preguntar qué tan bien localizado puede estar dicho observable. . ...
Esta es una respuesta interesante. Me pregunto qué tan cerca están los detectores de fotones individuales modernos de este límite de ruido relativista. ¿Tiene una relación de incertidumbre para los detectores que usan estas ideas?
@KFGauss No sé qué tan cerca están los detectores modernos de un solo fotón de este límite, pero sería interesante saberlo.
@KFGauss Con respecto a una relación de incertidumbre para los detectores, podemos construir detectores observables explícitamente en modelos que no tienen interacciones, como el campo escalar libre. Si son locales y están separados como en el espacio (por lo que no pueden aniquilar perfectamente el estado de vacío), entonces se desplazan. Si aniquilan perfectamente el vacío (por lo que no pueden separarse perfectamente como en el espacio), entonces no lo hacen, pero el enfoque habitual para derivar relaciones de incertidumbre no se aplica, porque supone que el conmutador conmuta con todo, lo que normalmente no es el caso de estos observables.
Esta respuesta es rica, pero obviamente se basa en la llamada interpretación indeterminista de Copenhague de QM. Donde niega la existencia de partículas puntuales cuando se aplica a QFT. Mi pregunta es: ¿qué pasa si le damos una oportunidad a otras interpretaciones en las que todavía queda algo de espacio para una noción contrafáctica de la ubicación exacta de las partículas? ¿Qué sucede en esos casos? ¿Tales interpretaciones exigen necesariamente algún conocimiento de las variables ocultas para construir un operador de posición absolutamente localizable?
@BastamTajik La respuesta asume la teoría cuántica (de campo), pero no asume ninguna interpretación específica. La idea de las variables ocultas va más allá de la teoría cuántica. Para responder a la pregunta que está haciendo, necesitaríamos un modelo específico de variables ocultas. QFT relativista no puede tener un operador de posición estricto, pero eso no significa que otras teorías no puedan (como las teorías de variables ocultas). ¿Qué otras teorías debemos considerar?

La idea "los fotones no tienen operador de posición" puede tener más significados dependiendo de a quién le preguntes.

Para mí, esta declaración significa algo muy específico: la radiación EM no consiste en partículas que podrían observarse en algún punto del espacio y podrían describirse por ψ ( r 1 , r 2 , . . . r norte ) función en el sentido de la interpretación de Born. En cambio, la radiación EM en sí misma está en todas partes y se describe adecuadamente mediante una función de 3 coordenadas espaciales: lo que se debe estudiar es el campo EM, no algunas partículas de luz. El campo puede ser un número c o un número q, pero el punto es que la entidad a describir es un campo, no un conjunto de partículas. Esta visión significa que no hay "partículas de radiación" reales volando en las moléculas de hidrógeno, en contraste con los electrones, que hay dos en cada molécula de hidrógeno neutral.

"Partículas de luz" o "fotones" es una palabra algo problemática, porque no tiene un concepto claro adoptado universalmente detrás de ella. El creador de la palabra significó algo muy diferente de lo que usamos este término después de finales de 1920. Hoy en día, a menudo se entiende como una forma abreviada de "trozo de energía". h F transferido entre la materia y la radiación de frecuencia F "; puede estar distribuido en alguna región del espacio pero no está localizado en ningún punto único del espacio.

Por supuesto, uno puede ir a los ejemplos simples y hablar de cosas como "1 fotón en modo (1,1,1,1), 2 fotones en modo (2,2,2,2)" como un estado de EM campo en una caja, pero estos estados son de todo el sistema, uno no puede ir y encontrar algunas cosas reales en algún punto del espacio dentro de la caja con más precisión que "en la caja".

Cuando se realiza un experimento de óptica utilizando un rayo láser, es perfectamente significativo hablar de fotones en el rayo.

La luz láser habitual está bien descrita por una onda EM clásica con un vector de fuerza eléctrica y un vector de onda definidos. Esto significa que no tiene un número definido de fotones, se describe mejor (si es necesario) como un estado coherente. Se puede hablar de fotones en superposición, pero entonces no hay un número definido de fotones de ningún tipo definido. Los fotones allí son una ficción matemática, repartidos de menos infinito a más infinito.

También podemos hablar de un fotón emitido por un átomo, en cuyo caso obviamente está localizado cerca del átomo cuando ocurre la emisión.

Sí, pero esta región es enorme, su tamaño es mayor que la longitud de onda de la radiación emitida. La afirmación es que no tiene sentido asignar una posición a esa radiación emitida dentro de esta región.

Además, en el análisis habitual del experimento de la doble rendija se tiene, al menos implícitamente, una función de onda para el fotón, que recupera con éxito el resultado de la escuela secundaria.

Sí, esto se debe a que la difracción en la rendija se puede analizar aproximadamente con modelos simplificados como la difracción del campo escalar. Esto no significa necesariamente que la función de onda de los fotones sea un concepto útil en problemas generales de interacción de la luz y la materia. Intente describir la emisión espontánea en términos de "función de onda del fotón".

En mi opinión, un fotón es un intercambio de energía que requiere 2 átomos, ya sea que estén separados por una pulgada o un millón de años luz. Nunca se genera ningún fotón hasta que el átomo 1 encuentra el átomo 2 y luego el campo EM existe por un período de tiempo dependiendo de esta distancia, esta es la función de onda. Podemos alterar esta función de onda antes de que ocurra la transferencia/colapso. La función de onda prefiere con alta probabilidad un camino que sea un número entero multiplicado por su longitud de onda (es decir, la cavidad del láser). Observamos el patrón de doble rendija (que no es una interferencia) como un patrón de caminos permitidos, brillante; y zonas oscuras sin caminos.

En realidad, a pesar del resultado negativo, existe un vector de posición para los fotones; pero es singular en el mismo sentido en que las coordenadas esféricas son singulares.

El problema se puede abordar mejor observando la clasificación de Wigner, pero dentro del marco de la geometría simpléctica, en lugar de los espacios de Hilbert.

El significado real y la importancia del teorema de no-go es que la clase de Wigner a la que pertenecen los fotones (que denomino, más adelante, la subfamilia helicoidal de los luxones, o los "heliones") no tiene descomposición de órbita de espín, de modo que el No se pueden desarrollar expresiones usuales para espín y posición para heliones. La geometría simpléctica de la subclase de helio comparte muchas características en común con la geometría simpléctica de los monopolos magnéticos (la última que se analiza en LNP 107), excepto que los roles de las coordenadas (q,p) se invierten.

Como todas las geometrías simplécticas, las coordenadas de una hoja simpléctica se emparejan en pares (q,p), y los heliones tienen 3 pares de Darboux, que se pueden organizar (con un poco de manipulación y ajuste) en la forma habitual (𝐫,𝐏) para la posición y el impulso. Pero a diferencia del vector de posición de Newton-Wigner, 𝐫 es singular cuando se expresa como una función de (𝐉,𝐊,𝐏,E) = (momento angular, momento de movimiento, momento, energía). Tiene una singularidad de coordenadas del tipo mencionado anteriormente.

Las clases de Wigner para el grupo de Poincaré consisten en lo siguiente:

(0) Homogeneous classes (unnamed by Wigner) (𝐏 ≡ 𝟎, E ≡ 0),

(1) Tardions (P² < αE²), where I will use α = 1/c² here and in the following,

(2) Luxons (P² = αE²), with 𝐏 ≢ 𝟎,

(3) Tachyons (P² > αE²).

donde ≡ se refiere a las condiciones que se cumplen en la hoja simpléctica que caracteriza la representación dada,

(La mayor parte de lo que describo aquí y más adelante, por cierto, también se aplica a la teoría no relativista, tomando α = 0; excepto que los Luxons y Tachyons se fusionan en una sola familia sin nombre: las representaciones de masa 0 para el grupo de Bargmann - una clase a la que llamé "Synchrons". También acuñé el término "Vacuon" para la clase (0).)

Sobre todas las clases, hay dos invariantes:

m² = M² − αP² = constant: mass shell constraint,

W² − αW₀² = constant: "spin/helicity shell" constraint
(the latter name being for lack of a better term),

donde, por conveniencia, también usaré M = αE para "masa en movimiento" aquí y más abajo; dónde

(W₀,𝐖) = (𝐏·𝐉, M𝐉 + 𝐏×𝐊)

es el vector de Pauli-Lubanski. Para tardanzas, el segundo invariante se reduce a

W² − αW₀² = m² S² (tardions only)

donde S es el espín; y hay descomposiciones para:

Angular Momentum (Spin-Orbit): 𝐉 = 𝐫×𝐏 + 𝐒

Moving Mass Moment: 𝐊 = M𝐫 − 𝐏t + α𝐏×𝐒/(m + M)

donde t puede seleccionarse arbitrariamente y 𝐫 ajustarse en consecuencia. Esto se puede invertir para expresar (𝐫,𝐒) en términos de (𝐉,𝐊), dando el resultado que se conoce como vector de posición "Newton-Wigner" para tardiones.

Para todas las familias (1), (2), (3), existe una subfamilia dada por (W₀,𝐖) = (0,𝟎) vector de Pauli-Lubanski - llamado "spin 0". Para esta clase también hay una descomposición similar:

Angular Momentum: 𝐉 = 𝐫×𝐏

Moving Mass Moment: 𝐊 = M𝐫 − 𝐏t

y uno puede escribir

𝐫 = 𝐊/M + 𝐯t, 𝐏 = M𝐯

La indeterminación en t -igual que ocurre generalmente con los tardions- caracteriza la trayectoria de una línea de tiempo:

{ (𝐫,t) ∈ ℝ³×ℝ: 𝐫 = 𝐊/M + 𝐯t }.

Para esta subclase, 𝐖 ≡ 𝟎, y W₀ ≡ 0, lo que resulta como una restricción secundaria.

Para la forma cuantificada de la descomposición simpléctica, 𝐊 y M están representados por operadores que no conmutan entre sí (sus paréntesis son [𝐊,M] = iħα𝐏), por lo que el cociente solo se determina hasta la "ambigüedad del ordenamiento de factores" - lo que aquí significa: hasta un múltiplo indeterminado de 𝐏, es decir, el término − 𝐏t en la expresión para 𝐊 ya sale automáticamente, en la forma cuantificada de la clasificación.

Para tardiones de espín distintos de cero, la expresión para 𝐫 es 𝐫 = 𝐫₀ + 𝐯t, donde 𝐫₀ es:

The Newton-Wigner Position Vector: 𝐫₀ = 𝐊/M − α 𝐏×𝐒/(m(m + M)).

La expresión para 𝐒 es

Spin Vector: 𝐒 = 𝐖/m − αW₀𝐏/(m(m + M))

Las características más importantes de las clases y subclases son que:
(a) cada una de ellas se caracteriza por los invariantes y por las condiciones que se les aplican,
(b) los invariantes subsidiarios también pueden ocurrir para las subfamilias,
(c) el número de parámetros libres que quedan después de eliminar las restricciones del conjunto (𝐉,𝐊,𝐏,M) (o (𝐉,𝐊,𝐏,E)) es par, (d) los parámetros libres restantes se emparejan en (q,
p) variables - que es el enunciado esencial del teorema de Darboux,
(e) tras la cuantización, estos pares producen pares de Heisenberg, y de ahí provienen las relaciones de Heisenberg.

Para las clases (1)-(3), los sistemas spin-0 tienen 4 restricciones (0 vector de Pauli-Lubanski) y, por lo tanto, 6 variables libres, que se combinan para darte los 3 pares de Heisenberg (𝐫,𝐏). El parámetro adicional t se puede normalizar a 0... que es como se hace normalmente con el vector de Newton-Wigner... y por lo tanto no es esencial. (En la versión cuantificada de la clasificación simpléctica, se normaliza 𝐊/M − 𝐏t al producto simétrico ½(𝐊M⁻¹ + M⁻¹𝐊).)

Para la clase (0) existen invariantes subsidiarias K² − αJ² y 𝐉·𝐊 que emergen, de modo que solo quedan libres como máximo 4 parámetros. Las subclases pueden tener 2 pares de coordenadas de Darboux (un "vacío con espín y momento") o 0 (el "vacío"); en el último caso, las restricciones adicionales son simplemente K² = αJ² y 𝐊 ≡ 𝟎.

Para la clase (1), las subclases de espín distintas de cero (es decir, donde S² > 0) tienen 4 pares de Darboux. El cuarto par corresponde al componente azimutal del momento angular y la longitud y normalmente se cuantifica mediante el número "m" para los estados de espín.

No describiré la clase (3) en detalle, ya que es un desastre. Todas las subfamilias de espín distinto de cero tienen 4 pares de Darboux.

Clase (2), los Luxons, tiene 3 subclases,

(a) spin 0: (𝐖, W₀) ≡ (𝟎, 0),

(b) helical: 𝐖 ∥ 𝐏, i.e. 𝐖×𝐏 ≡ 𝟎 (or equivalently, W² ≡ αW₀²), with 𝐖 ≢ 𝟎,

(c) general (or "continuous spin"), W² − αW₀² > 0

Tenga en cuenta que la identidad 𝐖·𝐏 = MW₀ se sigue de la definición del vector de Pauli-Lubanski, por lo que de la restricción M² = αP², debe seguirse que W² − αW₀² ≥ 0. La igualdad solo puede ocurrir si 𝐖 ∥ 𝐏, por lo que la las restricciones 𝐖×𝐏 ≡ 𝟎 y W² ≡ αW₀² son equivalentes para Luxons.

Las propiedades más importantes de estas subclases son que:
(a) la subclase de espín 0 tiene solo 3 pares de Darboux, que pueden representarse como (𝐫,𝐏),
(b₀) helicidad (es decir, la componente de 𝐉 paralela a 𝐏) es una invariante subsidiaria para la subclase helicoidal,
(b₁) la subclase helicoidal, por lo tanto, también tiene solo 3 pares de Darboux (!),
(c) la clase de espín continuo tiene 4 pares de Darboux, y no están representados por ninguna descomposición de órbita de espín (! !).

Los fotones caen en la subfamilia helicoidal. Lo mismo es cierto para todas las partículas fundamentales... en sus verdaderos estados sin masa antes de que se doten de la apariencia de masa por interacción con el bosón de Higgs. La razón de esto es que la carga nuclear débil es un múltiplo de la helicidad izquierda para la materia y la helicidad derecha para la antimateria y, en virtud de ser una carga, debe ser ante todo una propiedad invariable de la partícula, lo que significa que las partículas solo pueden ser heliones o espín 0. Es por eso que se requiere un mecanismo de Higgs para la teoría electrodébil.

No hay descomposición espín-órbita, per se, para la subfamilia helicoidal, simplemente porque solo hay 3 pares de Darboux, en lugar de 4. ¡La helicidad del fotón no es espín ! Clásicamente, esto corresponde al hecho (como ha señalado frecuentemente Hehl) de que el campo electromagnético libre no tiene corriente de espín y presenta un tensor de tensión simétrico. Para el campo electromagnético que interactúa (es decir, el campo en un medio), la corriente de espín sería proporcional a 𝐃×𝐄 + 𝐁×𝐇, que solo es distinto de cero si las leyes constitutivas para (𝐃,𝐁) versus (𝐄,𝐇) ... o (𝐄,𝐁) versus (𝐃,𝐇) ... no son isotrópicos.

Para los campos electromagnéticos dentro de un medio (como el agua), la luz va más lenta que la velocidad de la luz en el vacío, por lo que los cuantos vestidos correspondientes caerían en la clase tardion y tendrían descomposiciones en órbita de giro. En la versión cuantizada de esto, uno probablemente representaría tales "campos dentro de los medios" por Lagrangianos efectivos, integrando los modos externos que comprenden el medio, y los fotones vestidos adquirirían, además de los dos valores m = ± 1 que salen de helicidad - un modo extra para m = 0 y los fotones vestidos "adquirirían masa". Esto está directamente relacionado con el mismo fenómeno de la física del estado sólido que inspiró la idea del propio mecanismo de Higgs.

La pregunta que te haces es: ¿qué pasa con la subfamilia helicoidal? Como hay 3 pares de Darboux, entonces admiten una cuantización que tiene 3 pares de Heisenberg, sin perjuicio del llamado teorema de no-go. Lo que en realidad está diciendo es que no existe una descomposición espín-órbita ni ningún análogo del operador de posición de Newton-Wigner que pueda derivarse de esa manera.

Sin embargo, hay un operador de posición, ¡simplemente en virtud del hecho de que la representación simpléctica tiene 3 pares de coordenadas de Darboux! La situación, como la del mapeo de coordenadas para la esfera, es que en algún punto, las coordenadas serán singulares.

La esfera no admite un par de campos vectoriales linealmente independientes globalmente distintos de cero en ella. Una situación similar ocurre con la geometría simpléctica que caracteriza a los heliones. La similitud de su geometría simpléctica con la del monopolo magnético se ha observado en la literatura. La situación es análoga, excepto por la inversión (q,p).

Para escribir un operador de posición, puede comenzar simplemente escribiendo una descomposición análoga a la descomposición de "spin-helicidad" para tardions:

𝐉 = 𝐫×𝐏 + η𝐏/M, 𝐊 = M𝐫 − 𝐏t ⇒ W₀ = ηP²/M, 𝐖 = η𝐏

siendo la helicidad ηP/M = ηc.

De hecho, funciona, excepto que las relaciones de paréntesis de Poisson 𝐫-𝐫 adquieren un déficit que es proporcional a η. Es posible ajustar la definición de 𝐫 para eliminar este déficit, lo que da como resultado un par de Heisenberg de buena fe para (𝐫,𝐏), pero la expresión para 𝐫 será singular en las componentes de 𝐉 y 𝐊. Es una indeterminación de coordenadas, como la que tienen las coordenadas esféricas (r,θ,φ) en los polos cuando se expresan como funciones de coordenadas cartesianas (x,y,z).

¿Quieres ver qué es? (Masticándose un poco, después de toda esta larga discusión, ¿hmm?) ¿Debería decírtelo? (¡Provocación, burla!) No, creo que terminaré la respuesta aquí y lo dejaré colgado...

Bueno, en una segunda consideración...

Están en mis notas en alguna parte y tendré que mirar y verificar (y revisarlo de cerca).

Aquí lo tienes. No hay una solución. En su lugar, debes elegir un vector unitario 𝐧. Entonces puedes escribir la descomposición:

𝐉 = 𝐫×𝐏 + ηP²/M 𝐧×𝐏×𝐧/|𝐧×𝐏|², 𝐊 = M𝐫 − 𝐏t + η 𝐧·𝐏 𝐧×𝐏/|𝐧×𝐏|².

Esto se obtiene tomando el 𝐫 sin ajustar y haciendo un ajuste (𝐉,𝐊) → (𝐉 + δ𝐫 × 𝐏, 𝐊 + M δ𝐫) para un δ𝐫 adecuado que corrige el déficit en los paréntesis 𝐫-𝐫, conservando (W₀, 𝐖).

La representación es singular en las direcciones 𝐏 ∥ 𝐧, por lo que necesitas un segundo vector 𝐧 para cubrir esta región de la geometría simpléctica. Se requieren dos regiones y mapas de coordenadas, como mínimo, para cubrir la geometría simpléctica.

Es la misma situación que ocurre con los monopolos magnéticos, y η juega un papel análogo al producto de carga eléctrico-magnético.

Para encontrar 𝐫, tendrás que resolver las relaciones anteriores para 𝐫, lo cual te dejo a ti y al lector interesado.

Si examina el pequeño grupo para esta subclase, usando (𝛚,υ,𝛆,τ) para denotar infinitesimal (rotaciones, impulsos, traducciones espaciales, traducciones de tiempo), encontrará que incluye

(1) rotations 𝛚 ∥ 𝐏,
i.e. rotations along the axis collinear with 𝐏 or "helical" rotations,

(2) spatial translations 𝛆 ∥ 𝐏
combined with time translations τ such that ε = cτ,

(3) transverse boosts/rotations, 𝛚,υ ⊥ 𝐏,
combined with a compensating translations 𝛆,
such that 𝛚 = (𝐏/P)×υ/c and 𝛆P² + η𝛚 = 𝟎.

Las propiedades (1) y (2) solo 𝐫 como línea de mundo del centro de masa, mientras que la propiedad (3), que es solo un "impulso nulo" (combinado con una traslación perpendicular tanto al impulso como a 𝐏), muestra que hay una reubicación compensatoria de la línea mundial, bajo un impulso transversal.

Como han señalado otras respuestas, la primera tarea es definir qué se entiende por operador de posición. Es útil comenzar con algo más básico que QFT.

La noción de operador de posición en QM deriva de la noción de posición en la física clásica. En la física clásica, esta noción está obviamente bien definida: puedes saber dónde está una manzana simplemente mirándola. Esta posición tiene una evolución bien definida y no depende de cómo la midas.

En QM sabemos que el operador de posición no tiene que tener un valor definido en un estado. En principio, uno podría anticipar algo como esto: a medida que las cosas que mide se hacen más pequeñas, se vuelve más difícil medir la posición sin alterarla. Si no puedes medir algo sin alterar su valor, ¿cómo puedes decir que está bien definido? Sin embargo, esta anticipación no es lo que sucede. En QM, la falta de un valor definido de posición en algunos (la mayoría) de los estados no se debe a la perturbación de la medición, sino que es una propiedad fundamental de nuestro mundo cuántico. QM es muy interesante porque esta propiedad se activa antes de que las mediciones comiencen a ser demasiado invasivas. Consideremos un ejemplo concreto: medir la posición de un electrón no relativista. Podemos hacerlo dispersando un fotón y detectando adónde va este fotón. h v , podemos localizar el electrón dentro de Δ X = C / v . Supongamos que el electrón no recibe una patada relativista del fotón, de modo que permanecemos en el ámbito no relativista. Esto requiere h v metro C 2 . El durante el tiempo de medición 1 / v el electrón viajará como máximo C / v , por lo que nuestra estimación del error de medición es Δ X es válida. este error es Δ X = C / v h metro C , donde el lado derecho es arbitrariamente pequeño en el límite no relativista C , y por lo tanto Δ X también se puede hacer arbitrariamente pequeño.

Entonces, en QM no relativista, el operador de posición es de naturaleza mecánica cuántica, pero no hay ningún problema práctico para medirlo experimentalmente. El punto importante es que existe una universalidad en las medidas: podemos realizar diferentes medidas de la posición, pero todas estas medidas pueden describirse matemáticamente midiendo el operador de posición.

En QM relativista, también conocido como QFT, ahora tenemos ambos problemas: el sistema es mecánico cuántico y hay problemas prácticos al medir la posición experimentalmente. En la discusión anterior, podemos usar fotones de energías h v metro C 2 localizar electrones en Δ X h metro C , pero si vamos a más alto h v , comenzaremos a crear pares electrón-positrón, y ya no está claro lo que estamos midiendo: digamos que si generamos un par electrón-positrón, ¿qué posición de electrón estamos midiendo?

Aquí permítanme dar un paso atrás y discutir el problema formal de definir la posición en la teoría relativista clásica con partículas indistinguibles. Debido a que las partículas son indistinguibles, no podemos preguntar por la posición espacial de una sola partícula en función del tiempo. En cambio, la única pregunta sensata que se puede hacer es "¿cuántas líneas de tiempo se cruzan con un elemento de superficie espacial dado?" En otras palabras, queremos definir un número de partículas conservado actual j norte m ( X ) y medir su flujo a través de una superficie similar al espacio S ( S puede tener un límite y ser pequeño),

norte S = S j norte m ( X ) d S m .

Volviendo a QFT, el problema es que no hay un número de partículas actual, ya que el número de partículas no se conserva por interacciones. Se puede definir algo que, a su gusto, "parece" una corriente de número de partículas, pero no tendrá la propiedad de ser la cantidad universal medida por diferentes experimentos. En su lugar, diferentes experimentos medirán cada uno su propio observable, y estos observables serán, con suerte, equivalentes en el límite no relativista.

Uno puede preguntarse qué sucede en las teorías libres, donde uno puede imaginarse definiendo un operador de número de partículas. La respuesta es que no puedes medir nada en una teoría libre, ya que no hay interacciones. Puede escribir cualquier observable y declararlo como el operador de posición, pero no estará relacionado con ningún experimento. Tan pronto como te imaginas haciendo un experimento, introduces interacciones que rompen la conservación del número de partículas. (Estoy ignorando aquí los QFT integrables en 2d sin producción de partículas, que quizás merezcan su propia discusión).

Dicho esto, hay corrientes conservadas en QFT, por ejemplo, la corriente eléctrica, y es posible medirlas. En particular, para una corriente conservada j se pueden considerar observables de la forma

q S = S j m ( X ) d S m .
Estos observables son lo suficientemente universales porque los campos de calibre se acoplan a corrientes conservadas, y puede diseñar experimentos que interactúen con su sistema a través de estos campos de calibre. Por ejemplo, en la dispersión inelástica profunda, en una buena aproximación, mide los elementos de la matriz
H | j m ( X ) | X
dónde H es un estado hadrónico y X son varios estados finales, y j es la corriente eléctrica de QCD. Esto proviene de la dispersión de un electrón H . Al orden principal en la constante de estructura fina, el electrón emite un solo fotón virtual, que a su vez se acopla a j de QCD.

Tenga en cuenta que estos observables q S no vaya en contra de lo que se dice en la respuesta de Chiral Anomaly. En particular, a menos que S es una rebanada espacial completa, de modo que q S es la carga total, q S no tendrá un valor definido en el estado de vacío. En particular, no aniquilará el estado de vacío. Esto se debe a que cualquier experimento que mida q S interactuará con el sistema lo suficientemente fuerte como para tener una amplitud de crear pares de partículas-antipartículas. La prueba formal de esto está en la respuesta de Chiral Anomaly.

Introducción

Lo que esto significa realmente es que, a diferencia de la mecánica cuántica no relativista, en las Teorías Relativistas de Campos Cuánticos (RQFT, por sus siglas en inglés), como las que describen los fotones, la posición de una partícula, cualquiera, incluidas las partículas masivas como los electrones, nunca puede ser información arbitrariamente alta. No significa que no tenga ningún sentido hablar de posición en absoluto, al contrario de lo que suele pasar, pero sí tiene consecuencias sobre cómo describirlo matemáticamente.

Y creo que parte del problema es que el formalismo existente que a menudo se transmite sin cuestionar está bastante anticuado conceptualmente y tenemos formas mucho mejores de hablar de estas cosas en la era moderna. Esta publicación, para bien o para mal, intenta atravesar parte de ese legado y termina como un torbellino "tour de force" de la física clásica a la moderna, básicamente porque tenemos que conectarnos con tantos otros conceptos para llegar realmente a lo que está pasando aquí y ponerlo sobre una base conceptual sólida. Y creo que es una pena porque gran parte de la verdadera belleza de estas teorías no se aprecia con los tratamientos que reciben con tanta frecuencia.

Comprender esto requiere que seamos cuidadosos, ejercitar el Discernimiento, sobre una serie de cosas:

  1. lo que constituye una "partícula",
  2. que es "posición",
  3. ¿Qué significa tener "información sobre" algo como la posición de una partícula,
  4. qué es un "campo cuántico", y
  5. cómo describimos "partículas" en términos de tal cosa, y cómo una descripción en términos de tal afecta 1-3 arriba.

Sin ser precisos en cuanto a lo que significa cada uno de estos, no podemos entender correctamente esta declaración, ni desentrañar lo que está mal con los diversos pinchazos dados por muchas fuentes de calidad no tan buena. Por eso,

¿Qué es una "partícula"?

Para el primer punto, diremos que no podemos, en realidad, definir este tipo de concepto desde el punto de vista de las matemáticas formales, y no deberíamos. Es como que solo en matemáticas teóricas, tenemos ciertos "conceptos primitivos" como en la geometría euclidiana axiomática, tenemos líneas rectas o puntos, o de lo contrario, en la teoría de conjuntos, los conjuntos se consideran como tales. No son necesariamente "sin sentido", aunque a menudo, y creo que muy inútilmente, se afirma que así es como deben tratarse cuando realmente necesitamos ejercitar nuestro Discernimiento para separar el "significado" del uso en el formalismo matemático. Es, más bien, que describir su significado va más allá del ámbito de las matemáticas, sólo desde dentro del lenguaje formal matemático.("lenguaje formal" es aproximadamente el lenguaje de los símbolos matemáticos y lógicos, aquí), no hay un "significado" en el sentido de que no podemos escribir otra declaración de lenguaje formal diciendo cuál es. Sin embargo, decir que "no tiene significado" como absoluto, sin la debida atención a este calificador, es incorrecto: el significado es para nosotros , no los símbolos. Sería como decir que las palabras en este papel no tienen significado, cuando claramente lo tienen, o las letras individuales.

Entonces, una "partícula" aquí tiene un significado. Es una entidad imaginada que estamos usando en nuestro modelo; no sabemos si "realmente existe", pero existen en el modelo mental de la realidad que estamos tratando de hacer. Una partícula es un objeto muy pequeño, tan pequeño que matemáticamente le asignaríamos un tamaño de cero: ocupa una cantidad de espacio igual a un punto.

¿Qué es "posición "?

La "posición" es un poco más complicada de manejar, ya que parece que, de nuevo, muy a menudo, la fusión parece ocurrir aquí de que los fenómenos que discutiremos con respecto a la posición terminan de alguna manera teniendo relación con el tamaño, lo cual no es correcto. Para entenderlo, creo que tener experiencia con gráficos por computadora y diseño y modificación de juegos de computadora realmente ayuda. En los juegos de computadora, tienes "avatares" u "objetos" que son objetos geométricos abstractos. Están especificados por un archivo de geometría que es independiente de su uso dentro de un mundo de juego. Cuando se ponen en tales, se les daun parámetro llamado posición, que efectivamente hace referencia a un punto en el espacio del mundo del juego, y que clava una copia del objeto descrito por la geometría en el archivo de geometría en ese punto. El punto importante aquí es que si bien la posición hace referencia a un solo punto, su hecho de ser tal no es lo mismo que el objeto que tiene un tamaño de naturaleza puntual : el tamaño del objeto está definido por la geometría en el avatar: cuál es su ancho si tomas una cinta métrica (virtual) de un extremo al otro. En cambio, lo que sucede es que tenemos algún punto de referencia en el avatar y lo movemos para que coincida con el punto de posición.

En el caso de "partícula" y "posición" tomadas juntas, la partícula es un "avatar" que consta de un solo punto geométrico. La posición es entonces un parámetro que vamos a colocar en ese avatar que nos dice dónde aparece en nuestro modelo del mundo que tenemos en la cabeza (que podría traducirse a un modelo de computadora real, aunque QM y especialmente RQFT son notoriamente intratables para realmente hacer en la práctica ). Tenga en cuenta que lo que suceda con la posición no tiene relación con el "tamaño" de la partícula: eso está definido por la geometría en el avatar, y eso no cambia incluso si elimináramos el parámetro "posición" por completo.

(Si quiere matemáticas, un avatar es un conjunto de puntos extraídos de un espacio euclidiano con sus interrelaciones métricas preservadas, más un centro designado o punto de pivote. Creo que usar el concepto de avatar también ayuda mucho cuando se trata de, digamos, la dinámica clásica del cuerpo rígido y las coordenadas de posición y orientación. "Posicionar" el avatar puede considerarse como dejarlo caer en el espacio y luego aplicar transformaciones geométricas, por ejemplo, traslaciones y rotaciones, para alinear el pivote con las coordenadas dadas. El formalismo habitual de la física es realmente, creo, bastante anticuado, como se dijo.)

En la mecánica clásica, la posición se define por un triple de números reales, por ejemplo, las coordenadas cartesianas: ( X , y , z ) . Para avatares extendidos, también tenemos las coordenadas orientativas , por ejemplo ( θ R , θ PAG , θ Y ) (sí, soy partidario de los ángulos de Tait-Bryan; demándame, pero creo que son más intuitivos que los ángulos de Euler). Para una partícula, no hay coordenadas orientativas, o son irrelevantes, ya que es un solo punto.

Tal especificación de posición, decimos, toma información infinita , porque como estos son números reales , requieren un número infinito de dígitos para escribirlos exactamente en un caso general verdaderamente arbitrario. La mecánica clásica es, pues, una "teoría con información infinita".

¿Qué significa "información sobre" y qué hace QM?

En la mecánica cuántica, lo que sucede ahora es que cambiamos dos cosas: una es que tenemos que pasar de una visión "objetiva" a una "subjetiva": no vamos a hablar más sobre la posición "real" de una partícula. tiene quizás sin algunas excepciones calificadas, sino sobre qué información tiene un agente , alguna entidad capaz de interactuar y obtener información sobre un sistema externo, sobre la posición de esa partícula. Así, el Universo siempre tiene al menos doselementos en ella: objeto y agente. No podemos tomar una "vista de la nada" intrascendente o un "truco del ojo de Dios", para usar una terminología que hace eco a la filósofa feminista Donna Haraway, y tal vez a otros en una vena similar. Nuestra "vista" es de "algún lugar", y tenemos que tener en cuenta las interacciones del agente de visualización con su mundo.

De ahí que hablemos menos de la posición de la partícula y más del conocimiento del agente de dicha posición.

Cuando hacemos esto, en realidad ganamos flexibilidad descriptiva en el sentido de que podemos hablar sobre diferentes niveles de conocimiento a través de la maquinaria de la probabilidad bayesiana y la teoría de la información, "probabilidad como información", "esto de bit" (John Archibald Wheeler), sue my calcetines, funciona.

Glosando detalles, el resultado es que desechamos la asignación de coordenadas habitual ( X , y , z ) a favor de una función de distribución de probabilidad

ψ ( X , y , z )

en cambio. Además, debido a otras razones que no son inmediatamente relevantes para esta discusión, tenemos que hacer de esta función una función de probabilidad de valor complejo , no de valor real. Tal función de distribución puede dar "mala información" sobre la posición o "información restringida". Ahora puede que se pregunte cómo podemos llamar a esto limitado. Dije que tenía un valor real, ¿no? ¿No se necesita todavía información infinita para describir ψ , si no tal vez en un sentido "aún más"?

Claro, pero entonces deberíamos nuevamente hacer una distinción entre la "realidad" y nuestro modelo de la misma . ψ No es información que podamos cosificar como poseída literalmente por algo más de lo que tiene sentido cosificarla como un campo de onda existente real como lo hacen algunos. Es un modelo para la información del agente, uno que tiene mucha verborrea para hablar poco, por así decirlo, mucho "bazo", porque esa verborrea extra lo hace muy útil .en la construcción de una teoría precisa y predictiva. Pero, ¿por qué la probabilidad específicamente para capturar esta noción de "menor información"? Bueno, la probabilidad nos dice más acerca de menos porque dice que en lugar de una única alternativa, hay una serie de alternativas "posibles" ponderadas de manera diferente. Si digo que solo estoy 75% seguro de algo, eso es "menos informativo" para usted que si digo que estoy 100% seguro. Del mismo modo, para una distribución de probabilidad, cuanto más "amplia" es, abarcando más posibilidades, menos informativa es, y cuanto más "ajustada", más informativa. (El "contenido de información" exacto o, mejor, el "grado de privación de información" en un PD se puede cuantificar por su entropía de Shannon , H .)

Campos cuánticos

Ahora admito que voy a acelerar el ritmo ya que no quiero recapitular toda la física en una sola publicación, pero el siguiente paso es ir a los campos cuánticos lo más rápido que pueda. Verá, de manera más general, no hablamos únicamente de funciones de la forma dada anteriormente para una sola partícula. En cambio, hablamos de un objeto matemático llamado vector de estado cuántico que se puede "decodificar" para revelar distribuciones de probabilidad sobre muchos parámetros diferentes de esa partícula, como no solo su posición sino también su velocidad, orientación (si la tenemos), etc. adelante. Estas cosas se denotan con símbolos como | ψ , llamado "signo de ket". Las "decodificaciones" de él en posiciones y velocidades (mejor, momentos ) son descritas por operadores que actúan sobre estos vectores, básicamente solo funciones, que comen un vector y crean otro.

En QM no relativista, eso se traduce en tener un operador posicional X ^ y un operador momentáneo (también llamado operador de impulsión ) PAG ^ .

Estos operadores "descodifican" la posición y el momento al "etiquetar" efectivamente los vectores de estado cuántico como casos representativos en los que tenemos información infinita sobre la posición y el momento, respectivamente. es decir, la existencia del operador posicional X ^ va de la mano con la existencia de casos | X donde la función de onda correspondiente ψ es una función delta centrada en X . Estos se denominan "estados propios" de posición, y la decodificación se produce mediante la expansión de un vector de estado en componentes tratados con un conjunto básico de estilo de álgebra lineal.

Ahora, este formalismo funciona muy bien cuando estamos considerando una sola partícula, pero rápidamente se vuelve malo cuando se trata de múltiples partículas, nuevamente omitiendo detalles sobre por qué, quiero llegar allí, POR FAVOR ... Y debido a eso, La teoría del campo cuántico es, efectivamente, una forma de tratar con esas partículas múltiples de manera mucho más limpia, mediante el uso de un dispositivo matemático llamado "campo cuántico".

Básicamente, lo que eso significa es que hablaremos de un vector de estado (datum de información) no de una sola partícula o de un número determinado de partículas, sino de un sistema que puede contener cualquier número de partículas y, además, a qué partículas pueden agregarse o eliminarse. Así es como funciona. Empezamos con un vector de estado de vacío | 0 , que se dice que no contiene partículas, que ocupa un espacio vectorial adecuadamente rico para hacer factible todo lo que vamos a hacer con él. Luego proclamamos la existencia de un operador de creación y destrucción (función de vector a vector, ¿recuerdas?) a y a . Hay un operador de este tipo para cada vector de posición X , p.ej a ( X ) . (Alternativamente, podemos escribir a ( X , y , z ) para hacer explícitas las coordenadas de posición.)

Ahora esto a actúa efectivamente como un "pincel" que podemos usar para "pintar" partículas en el campo cuántico. si aplico a ( X ) a | 0 , crea un vector con una partícula con posición exacta (es decir, como la función delta) X . es decir, el vector | ϕ 1 partícula := a ( X ) | 0 , representa (información que dice que) el campo cuántico está reteniendo una sola partícula con una posición exacta X , es decir, una partícula cuya función de onda

ψ ( X , y , z )

es un pico delta en X . Si tuviéramos que aplicar a de nuevo , es decir, decir a ( X 2 ) | ϕ 1 partícula , ahora instanciamos una segunda partícula en el campo cuántico con posición exacta X 2 . Tenga en cuenta que lo que es la partícula no ha cambiado: la denotación de lo que a created sigue siendo la ubicación para fijar el avatar del punto, solo las matemáticas que estamos usando para hablar sobre él, y eso es algo a tener en cuenta para los últimos bits aquí.

Por lo tanto, debe tener en cuenta que no es adecuado, entonces, tratar de aplicar repetidamente a para tratar de obtener una partícula con una posición indeterminada. En cambio, y para aclarar realmente por qué uso el término "pincel", para representar una partícula con una posición indeterminada, debemos superponer una serie de estados de una partícula , obtenidos al operar con a solo una vez en el estado de vacío pero en cada posición posible , lo que hacemos con una integral:

| ϕ 1 partícula de postura borrosa := R 3 [ ψ ( X , y , z )   d V ]   a ( X ) | 0

Así es como expresaríamos la ψ función en términos de superposición de estados propios de posición en la mecánica cuántica ordinaria para construir la función de onda, excepto que ahora estamos superponiendo estados del campo cuántico .

RQFT

Entonces, ¿qué hace la teoría cuántica relativista ? Bueno, la introducción de la relatividad hace que suceda algo divertido. Efectivamente, intuitivamente, nuestro pincel "afilado" a que probablemente se considere más acertadamente como un bolígrafo, se convierte en uno grueso y rizado, un pincel "verdadero" de hecho: en sí mismo solo puede pintar estados a los que les falta información de posición en el sentido anterior, que tienen una extensión no trivial (y en realidad infinita soporte, es decir, nunca llegan a cero por completo). Peor aún, ¡los estados con información de posición ilimitada ni siquiera existen, para empezar! La misma técnica de pintura funcionará, pero se convierte en una especie de "pelusa de pelusa" y la función de peso ψ en la integral pierde parte de su significado original. El Universo, efectivamente, tiene un fuerte límite superior en cuanto a la cantidad de información que puede existir para definir la posición de una partícula, no solo un límite en la información conjunta de posición y momento según el principio de Heisenberg.

Esto no significa que la posición no exista o que no tenga sentido hablar de ella, más que el hecho de que la posición sea "borrosa" (falta de información) en la mecánica cuántica ordinaria. Tampoco significa que la partícula no tenga el tamaño de un punto; recuerde, esa pregunta se refiere al "avatar" que separamos anteriormente, no a lo que sea que estemos usando para colocarlo en el espacio, y hay experimentos en este sentido que establecen el " tamaño" de las partículas como si fueran realmente muy pequeñas (estos no funcionan localizando , sino más bien dispersando partículas, en una versión muy madura de las técnicas iniciadas por Rutherford para estudiar el núcleo atómico).

Sin embargo, se necesita un cambio en la descripción matemática de tal "posición". ¿Recuerda que acabo de decir eso antes de que describiéramos posiciones de una partícula con operadores que "marcan" estados de posición exactos ? Bueno, ya no tenemos esos (si los tuviéramos, entonces podríamos usarlos para hacer un afilado a cepillo, pero no podemos), por lo que la idea original de tratar de averiguar qué X ^ significado en términos de "estados propios", ¡se ha ido! ¡ El formalismo del operador que habíamos estado usando antes, ya no funciona para hablar sobre la posición de las partículas! (Aún funciona de otras maneras ya que, arriba, solo usamos el "operador de pintura" a , ¡pero no de esta manera!) En cambio, debemos usar otras herramientas para describir la situación de "lo que está pasando en el espacio", que algunas de las otras publicaciones aquí han cubierto, y aunque podría entrar en eso, estoy siendo un poco reprimido ahora y, además, creo que esto es lo suficientemente lejos como para clavar la declaración en cuestión y lo que significa.

(Además, tal vez, esto sugiere que deberíamos llamar a la teoría cuántica de campos mejor como "mecánica cuántica de pincel" o "física del pintor" :))

Responderé como un físico de partículas experimental. Este es el experimento de doble rendija, un solo fotón a la vez:

monofoto

Grabación de una cámara de un solo fotón de fotones de una doble rendija iluminada por una luz láser muy débil. De izquierda a derecha: fotograma único, superposición de 200, 1'000 y 500'000 fotogramas.

Es evidente experimentalmente que los fotones individuales golpean la pantalla de la cámara, por lo que el problema de un operador de posición es un problema de teoría matemática, no un problema de observación experimental.

Mi impresión de la teoría cuántica de campos es que, en general, los campos que representan todas las partículas sobre las que actúan los operadores para crear o aniquilar partículas, son soluciones de onda plana de la ecuación mecánica cuántica correspondiente: Dirac para fermiones, Klein Gordon para bosones, Maxwell cuantizado para fotones. . Como es bien sabido, las ondas planas cubren todo el espacio-tiempo, por lo que no creo que tenga sentido que los operadores de posición actúen sobre los campos mismos. La teoría tiene que usar un paquete de ondas para definir una partícula real localizada en el espacio y el tiempo, afaik.

En general, encuentro que la mayoría de las personas con inclinaciones teóricas tienden a ver las matemáticas de la teoría como generadoras del mundo real, y no al revés, las matemáticas que modelan el mundo real. Los útiles modelos QFT usan paquetes de ondas para medir partículas reales en experimentos, si es necesario definir la ubicación probable de la partícula, como en el experimento de doble rendija, nuevamente AFAIK.

Incluso en este caso, la figura que muestra la ubicación de un fotón no es un único punto geométrico para referirse a él como la posición del único fotón. De hecho, es un gaussiano muy estrecho con baja resolución. Y experimentalmente tiene sentido. Ya que el fotón independientemente de interactuar con un solo electrón o más del detector, no es lo que se observa, sino la huella de las interacciones entre los electrones de los detectores luego de la absorción del primer fotón.
@BastamTajik pero, después de todo, todo es un rastro, una serie de rastros anidados que nuestro cerebro interpreta, en este caso, un punto en una pantalla como una huella del fotón que se dispersa por las rendijas. Luego obtenemos muchos puntos y tenemos la teoría de la mecánica cuántica y QFT para modelarlo matemáticamente.
Su afirmación es verdadera y es un ejemplo de la crítica de Kant a la razón pura. Lo que simplemente dice que la verdad no es observable.
Pero lo que nos preocupa aquí, es un problema más bien filo-matemático-físico que si es posible hablar sobre la posición de las partículas en absoluto "independientemente de la observación", ya que QFT nos impide tal conducta (ya que es un teoría de la observación (tal como la conciben los fundadores y la sociedad científica) y la indeterminación (no importa debido a su esencia observacional o al comportamiento indeterminista intrínseco de la naturaleza) una parte indispensable de ella) estamos desconcertados de que si el objetivo es realmente lo que dice QFT .
Por lo tanto, solo podemos renunciar a un mundo objetivamente indeterminista o recurrir a alguna teoría de "Variables ocultas" que nos permita revivir la noción de "Partículas" y su localización completa o, al final, tal vez QFT es simplemente una Teoría Estadística Efectiva de la naturaleza y ¡En principio, no se puede relacionar con sistemas de una sola partícula!

Después de los comentarios correctos, estoy de acuerdo con las otras respuestas sobre QM clásico y el operador de posición. Mi respuesta es sobre el tiempo propio y QM relativista (QFT) y que los fotones no tienen un tiempo propio. Sin embargo, puede definir un parámetro afín λ que aumente monótonamente a lo largo de la línea de mundo similar a la luz. Pero aún así, los fotones no tienen un tiempo adecuado y en QM relativista (QFT) esto (definiendo un estado propio de posición) violará la casualidad.

¿Cómo definir el tiempo propio de un fotón?

Un punto en el espacio de Minkowski es una posición temporal y espacial, denominada "evento", o a veces la posición de cuatro vectores o de cuatro posiciones o de 4 posiciones, descrita en algún marco de referencia por un conjunto de cuatro coordenadas: Al considerar fenómenos físicos , las ecuaciones diferenciales surgen naturalmente; sin embargo, al considerar las derivadas de funciones en el espacio y el tiempo, no está claro con respecto a qué marco de referencia se toman estas derivadas. Se acuerda que las derivadas temporales se toman con respecto al tiempo propio {\displaystyle \tau } \tau . Como el tiempo propio es un invariante, esto garantiza que la derivada del tiempo propio de cualquier cuadrivector es en sí misma un cuadrivector.

https://en.wikipedia.org/wiki/Cuatro-vectores

SI no tiene el tiempo adecuado para los fotones, no puede usar el diferencial del vector de cuatro posiciones. Por lo tanto, no puede definir un operador de posición para el fotón.

Un fotón es una partícula elemental en el SM, el cuanto del campo EM y la radiación, en forma de punto, sin extensión espacial o subestructura, el portador de fuerza de la fuerza EM, y no tiene masa.

Es posible emitir fotones individuales, así que asumiré que estás preguntando por eso.

Como todas las partículas elementales, los fotones actualmente se explican mejor por la mecánica cuántica y exhiben dualidad onda-partícula, exhibiendo propiedades tanto de ondas como de partículas. Por ejemplo, un solo fotón puede ser refractado por una lente y exhibir una interferencia de onda consigo mismo, y puede comportarse como una partícula con una posición o momento medible definido y finito, aunque no ambos al mismo tiempo según el principio de incertidumbre de Heisenberg. Las cualidades cuánticas y de onda del fotón son dos aspectos observables de un solo fenómeno, no pueden ser descritos por ningún modelo mecánico; [2] una representación de esta propiedad dual de la luz que asume ciertos puntos en el frente de onda como el asiento de la energía es imposible. Los cuantos en una onda de luz no están espacialmente localizados.

https://en.wikipedia.org/wiki/Photon

Así que digamos que hay consenso sobre qué es un fotón.

Empecemos a entender el problema, por qué los fotones no tienen posiciones, entendiendo cómo se pueden crear y aniquilar los fotones (porque solo pueden tener una posición mientras existan).

Los fotones se emiten en muchos procesos naturales. Por ejemplo, cuando se acelera una carga, emite radiación de sincrotrón. Durante una transición molecular, atómica o nuclear a un nivel de energía más bajo, se emitirán fotones de varias energías, desde ondas de radio hasta rayos gamma. Los fotones también se pueden emitir cuando se aniquila una partícula y su correspondiente antipartícula (por ejemplo, aniquilación electrón-positrón).

Básicamente, existe un consenso sobre cómo se pueden crear y aniquilar los fotones:

  1. emisión (creación)

  2. absorción (aniquilación)

Básicamente, podemos decir que al menos hay consenso sobre el tiempo de existencia de un fotón.

Ahora es muy importante entender por qué se planteó esta pregunta. ¿Cuándo tiene el fotón una posición? Cuando existe. ¿Cuándo existe el fotón? ¿En qué plazo?

Este es el punto principal. La pregunta solo tiene un mérito en nuestro marco de tiempo (¿por qué tener masa en reposo y experimentar el tiempo de manera diferente a un fotón?).

Ahora los fotones no tienen masa, según SR, no tienen un marco de referencia. No tiene sentido hablar de lo que ve un fotón cuando viaja entre emisión y absorción.

La pregunta, ¿por qué los fotones no tienen una posición? se plantea porque en nuestro marco de tiempo, nos movemos a lo largo de líneas de mundo similares al espacio y al tiempo (los fotones son similares a la luz).

Hay tres casos:

1.spacelike, en este caso, es la distancia física entre dos puntos en el espacio.

curvas similares al espacio que caen fuera del cono de luz. Tales curvas pueden describir, por ejemplo, la longitud de un objeto físico. La circunferencia de un cilindro y la longitud de una barra son curvas similares al espacio.

  1. timlike, estos deben caer dentro de los conos definidos por conos de luz

curvas similares al tiempo, con una velocidad menor que la velocidad de la luz. Estas curvas deben caer dentro de un cono definido por curvas similares a la luz. En nuestra definición anterior: las líneas del mundo son curvas similares al tiempo en el espacio-tiempo.

  1. como la luz, esto es lo que hacen los fotones, básicamente viajan distancias espacio-temporales de 0 entre la emisión y la absorción

curvas similares a la luz, teniendo en cada punto la velocidad de la luz. Forman un cono en el espacio-tiempo, dividiéndolo en dos partes. El cono es tridimensional en el espacio-tiempo, aparece como una línea en los dibujos con dos dimensiones suprimidas y como un cono en los dibujos con una dimensión espacial suprimida.

Ahora su pregunta es porque nosotros, que tenemos masa en reposo, vivimos a lo largo de 1. y 2. líneas de tiempo. Según SR, no conocemos 3. líneas de tiempo parecidas a la luz, al menos no sabemos cómo se vería eso, ya que no tiene sentido hablar de un marco de un fotón.

La línea de mundo (o línea de mundo) de un objeto es el camino que el objeto traza en el espacio-tiempo de 4 dimensiones. Es un concepto importante en la física moderna, y particularmente en la física teórica.

https://en.wikipedia.org/wiki/World_line

Ahora estás preguntando por qué no podemos definir la posición de un fotón en el espacio (3D).

La regla de Born da la probabilidad de que una medición QM arroje un resultado dado.

En su forma más simple, establece que la densidad de probabilidad de encontrar la partícula en un punto dado es proporcional al cuadrado de la magnitud de la función de onda de la partícula en ese punto.

Así que hay consenso sobre cuál debería ser la posición. Debería haber una probabilidad de encontrar la partícula en cierta posición en el espacio (3D).

Ahora están las razones por las que no podemos dar una posición para el fotón:

  1. está solicitando una posición para un fotón (por supuesto porque vivimos en un mundo masivo donde experimentamos el tiempo entre la emisión y la absorción) en un espacio o tiempo como línea de tiempo.

  2. estás pidiendo una posición en el espacio (3D), y el espacio es continuo.

  3. medición, eso es observación, lo que significa interacción con el fotón, ahora quieres la posición del fotón sobre la marcha, eso es entre emisión y absorción, y eso solo es posible con dispersión elástica e inelástica

El fotón solo existe en la línea de tiempo similar a la luz, donde la distancia espacio-temporal entre la emisión y la absorción es 0. Esto hace que el problema con 1., donde está solicitando una posición para el fotón entre estos dos puntos, que están separados por una distancia ( 3D) solo en nuestro mundo (donde tenemos masa en reposo), pero en el mundo del fotón no tiene tal posición (o distancia) intermedia.

Estás pidiendo una posición en el espacio (3D) en un tejido de espacio-tiempo, que es continuo, y estás tratando de modelarlo como discreto, pero en realidad es continuo.

En la mecánica cuántica, el principio de incertidumbre (también conocido como principio de incertidumbre de Heisenberg) es cualquiera de una variedad de desigualdades matemáticas[1] que afirman un límite fundamental a la precisión con la que ciertos pares de propiedades físicas de una partícula, conocidas como variables complementarias o canónicamente pueden conocerse variables conjugadas como la posición x y el momento p.

https://en.wikipedia.org/wiki/Incertidumbre_principio

Esto significa que podemos intentar restringir el fotón a un espacio pequeño. ¿Relativo a qué? ¿Nuestro mundo? nuestros dispositivos? Cualquiera que sea la medida que usaría, el espacio-tiempo es continuo y está solicitando una medida discreta.

La única forma de medir la posición del fotón es interactuar con él. Pero quieres hacerlo sobre la marcha, entre emisión y absorción, y para hacerlo necesitas:

  1. dispersión elástica, el fotón mantendrá su energía y fase y cambiará de ángulo

  2. dispersión inelástica, el fotón mantendrá parte de su energía y fase y cambiará de ángulo

Cualquiera que elija, tendrá que obedecer al HUP.

Aunque la posición de una partícula masiva es observable en la mecánica cuántica no relativista, la posición del fotón es un concepto controvertido. Se ha argumentado que no hay densidad de número de fotones, solo densidad de energía [1]. Las soluciones a la ecuación de onda del fotón son campos eléctricos y magnéticos, pero la relación entre estos campos y la amplitud del número de fotones normalizable de Laudau-Peierls (LP) no es local [2, 3]. La localización de un pulso de fotones convergentes (o divergentes) no puede ser exacta ya que, según el teorema de Paley-Weiner, debe tener colas subexponenciales [4].

https://www.researchgate.net/publication/45927278_Photon_position_measure

Así que básicamente la respuesta a tu pregunta es:

  1. no hay posición entre la creación y la aniquilación de un fotón, en una línea de mundo similar a la luz

  2. el espacio-tiempo es continuo, y usted está pidiendo una posición discreta

  3. la única forma de medir la posición del fotón sobre la marcha entre emisión y absorción es con dispersión elástica e inelástica, y eso nuevamente obedece al HUP

Esto realmente no tiene sentido para mí. En ninguna parte de la pregunta exige que la posición sea discreta, y la lógica por la que concluye que la distancia espaciotemporal cero significa que no puede preguntar la posición de un objeto que se mueve a lo largo de una curva nula no es clara y claramente falsa: no hay contradicción en la relatividad clásica para preguntar por la posición de un objeto sin masa que se mueve a lo largo de una curva nula. Es solo en la mecánica cuántica relativista que esto se vuelve infundado, y esta respuesta no hace nada para explicar eso.
El propósito de la gran cantidad de cotizaciones para material bastante estándar tampoco está claro.
@ACuriousMind Estoy de acuerdo con las otras respuestas sobre QM clásico. Sin embargo, editaré mi respuesta ya que estoy hablando del tiempo adecuado y QM relativista.