¿Cómo encajan los productos tensoriales y las sumas directas en la mecánica cuántica?

Entiendo que a veces se toman productos tensoriales o sumas directas entre espacios de Hilbert en mecánica cuántica. Sin embargo, no sé cuándo se puede hacer esto o cuándo se debe hacer. Me gustaría que esto se explicara minuciosamente . En particular, ¿dónde encaja esto con respecto a los axiomas de la mecánica cuántica? Entiendo que puede haber más de un conjunto de axiomas para la mecánica cuántica, así que adherirnos a estos (que pueden ser defectuosos):

I. El estado de un sistema está representado por un rayo de un espacio de Hilbert H , cuyos vectores se llaman kets.

II. Correspondiente a cada observable A es un operador hermitiano A ^ en H .

tercero Al medir un observable A de un sistema en un estado representado por un rayo con representante normalizado Ψ , el resultado de la medida será uno de los valores propios a de A con probabilidad a , Ψ , dónde a es el vector propio normalizado correspondiente al valor propio a . Además, el estado del sistema será el representado por a .

IV. un ket Ψ que representa un sistema evolucionará de acuerdo con la ecuación de Schrödinger.

Relacionado/posible duplicado: physics.stackexchange.com/q/54896/50583
¿Puede aclarar qué quiere decir con un "grado de libertad"?
@knzhou En realidad, no sé a qué me refiero, pero tengo la idea de que, para ser muy general, es necesario hablar de grados de libertad.
Para ser franco, las dos recompensas que ha ofrecido son extremadamente difíciles de responder, porque insiste en una explicación de las cosas más fundamentales en términos de las menos fundamentales.
Por ejemplo, en su otra generosidad, solicita una descripción general del Lagrangiano en términos de energía cinética y potencial. Pero el Lagrangiano es la idea más general. Muchos sistemas descritos por la mecánica lagrangiana no tienen nociones significativas de energía cinética y potencial en absoluto; en cambio, estas cantidades se derivan del lagrangiano en casos simples.
Y aquí insistes en una explicación de los axiomas cuánticos en términos de la idea intuitiva clásica de los grados de libertad. Pero en realidad, la noción de grados de libertad clásicos surge de la mecánica cuántica. Su noción de ser más general es en realidad una solicitud para ser menos general.
Imagina que en la escuela primaria aprendes geometría usando reglas y crayones, luego en la escuela secundaria aprendes los axiomas de la geometría euclidiana. Las cosas que aprendiste en la escuela primaria se derivan de esos axiomas, no al revés. Lo que está pidiendo es como exigir que los axiomas se reformulen en términos de crayones, para que sean "muy generales".
@knzhou Bueno, sé muy poco y mis preguntas reflejan mi punto de vista ingenuo.

Respuestas (4)

producto tensorial

Escribiendo el espacio de Hilbert como un producto tensorial

H = H A H B
puede ser útil cuando queremos pensar en H A y H B como dos subsistemas complementarios del sistema completo. Observables asociados con el subsistema A actuar como la identidad en el otro factor H B , y por el contrario. Por ejemplo, un observable asociado con el subsistema A tiene la forma O A 1 . Un observable general afecta a ambos H A y H B . Es decir, un observable general es una suma de términos de la forma O A O B donde los operadores O A / B actuar solo en A / B respectivamente.

En particular, si H = H A H B , el hamiltoniano en la ecuación de Schrödinger es una suma de términos de la forma O A O B . En particular, los términos de la forma O A 1 y 1 O B describir la dinámica de la A y B subsistemas por sí mismos, y todos los demás términos describen interacciones entre estos subsistemas.

Otro ejemplo es una partícula no relativista con espín: podemos expresar el espacio de Hilbert como un producto tensorial H X H S , donde los observables asociados con la ubicación de la partícula tienen la forma O X 1 y los observables asociados con su espín tienen la forma 1 O S . En este caso, las diferentes partes suelen denominarse diferentes "grados de libertad" en lugar de diferentes "subsistemas". En el caso de una partícula no relativista, podemos factorizar aún más H X en tres factores asociados a las tres dimensiones del espacio. Nuevamente, normalmente llamaríamos a estos "grados de libertad" en lugar de "subsistemas".

Muy generalmente, podemos definir un "subsistema" o "grado de libertad" como una colección especial de observables. La construcción del producto tensorial no es necesaria para esto, pero suele ser útil. Si los observables asociados con diferentes subsistemas (o grados de libertad) se conmutan entre sí, entonces el producto tensorial suele ser útil como una forma sistemática de delimitar matemáticamente los diferentes conjuntos de observables: cada conjunto actúa de manera no trivial en solo uno de los factores tensoriales.

Los conceptos de "subsistemas" y "grados de libertad" son solo casos especiales vagamente delineados de una idea mucho más general: subconjuntos que se conmutan mutuamente del conjunto de observables. El mismo espacio de Hilbert admite muchas factorizaciones diferentes de productos tensoriales. Cuál es más útil (si lo hay) depende de qué operadores queremos representar qué observables físicos, las decisiones que tomamos cuando estamos definiendo un modelo. Un comentario similar se aplica a las definiciones/medidas más comunes de "entrelazamiento", porque se refieren a una factorización del producto tensorial dada.

Aprender sobre la "propiedad de división" en la teoría cuántica de campos revela algunas limitaciones de la formulación del producto tensorial. La propiedad dividida se menciona en esta publicación relacionada:

¿Debería ser obvio que los estados cuánticos independientes se componen tomando el producto tensorial?

El producto tensorial también tiene otros usos. Por ejemplo, para una sola partícula en reposo en el espacio tridimensional, podemos expresar sistemáticamente el espín. j representación para cualquier j tomando el producto tensorial de 2 j copias de la representación spin-1/2 y simetrización. Podemos pensar en esto como una aplicación especial de la idea de subsistema, porque una colección simetrizada de 2 j spin-1/2 partículas tiene giro total j .

Los axiomas I-IV enumerados en el OP son los mismos ya sea que H se escribe como un producto tensorial, porque esos axiomas son independientes de la representación que usemos para el espacio de Hilbert.

suma directa

Escribiendo el espacio de Hilbert como una suma directa

H = H 1 H 2
es útil cuando queremos centrarnos en un subespacio particular de estados. Usando un modelo de partícula única no relativista como ejemplo, H 1 podría consistir en estados en los que la función de onda de una partícula tiene soporte solo dentro de una región dada R , y H 2 podría consistir en estados con apoyo en el complemento de R .

En términos más generales, dado cualquier observable discreto (como el observable que pregunta "¿la partícula está ubicada en la región R o no?"), podemos escribir H como la suma directa de los espacios propios de ese observable. Una descomposición de suma directa del espacio de Hilbert corresponde a una representación de matriz de bloques de operadores en el espacio de Hilbert.

Más esotéricamente, la suma directa también es útil para representar estados mixtos como estados vectoriales : cada estado, ya sea puro o mixto, puede expresarse como un estado vectorial en un espacio de Hilbert suficientemente grande, con el entendimiento de que todos los observables tienen un bloque diagonal. forma que no mezcla los diferentes sumandos directos entre sí. Este hecho a veces es útil para probar teoremas, y este hecho a su vez puede probarse usando la Construcción GNS.

Nuevamente, los axiomas I-IV enumerados en el OP son los mismos ya sea que no H se escribe como una suma directa, porque esos axiomas son independientes de la representación que usemos para el espacio de Hilbert.

Creo que por "subsistema" te refieres a un subconjunto de grados de libertad. ¿Le importaría aclarar qué quiere decir con "subsistema"?
@PiKindOfGuy Agregué algunos párrafos más en la sección sobre productos tensoriales, incluido otro ejemplo y una perspectiva general. Respuesta corta: la separación conceptual de un sistema en diferentes "subsistemas" o "grados de libertad" corresponde a una elección matemática de subconjuntos del conjunto de observables que se conmutan mutuamente. Los observables se pueden organizar en dichos subconjuntos de muchas maneras diferentes, por lo que es tan difícil precisar una definición específica única de "subsistema" o "grado de libertad".

Una respuesta muy breve y muy útil, solo con respecto a los aspectos físicos del producto tensorial y la suma directa:

La suma directa suma espacios de Hilbert de tal forma que son separables unos de otros. En su hamiltoniano, notará esto como matrices de bloque agregadas en las diagonales, que actúan en partes separadas del vector de funciones de onda que describe su sistema.

El producto tensorial mezcla las cosas. Si realiza el producto tensorial de dos matrices, escribe la segunda matriz en su totalidad en cada entrada de matriz de la anterior, multiplicada por el número que estaba previamente en esa entrada. Cada matriz tiene un conjunto de estados propios. Ahora puede construir una base para esta nueva matriz mediante la "combinación" de las dos bases anteriores de estados propios en una nueva. Con combinación quiero decir que los vectores se construyen de manera similar a la matriz, en cada entrada del vector propio de la primera matriz, los vectores propios de la segunda matriz, multiplicados por el número que estaba previamente en esa entrada. Esta nueva base ya no es una base de vectores propios.

Este último ahora se puede reducir al primero, lo que significa que puede llevar el último en forma de bloque diagonal para separar su sistema en varios subsistemas.

Aplicación: desea describir dos partículas de espín-1/2 en un sistema. Cada partícula tiene los estados |arriba>, |abajo>.

El espacio de Hilbert que recupera del PRODUCTO TENSOR tiene los estados que normalmente se denotan como |arriba>|arriba>,|arriba>|abajo>,|abajo>|arriba>,|abajo>|abajo>. Estos son realmente los productos tensoriales de los estados originales. Digamos que elijo una base |arriba>=(1,0), |abajo>=(0,1), entonces |arriba>|abajo> es |arriba> x |abajo> = (1*(0,1), 0*(0,1)) = (0,1,0,0). Denoté el producto tensorial como "x", porque no sé cómo enviar mensajes de texto aquí.

Pero como sabemos, podemos separar el problema en un sistema de espín 1 y espín 0, donde el sistema de espín 1 es tridimensional (Sz-valores propios: 1,0,-1) y el sistema de espín 0 es unidimensional (Sz -valores propios: 0). ¿Por qué diferenciamos los sistemas "Spin 1" y "Spin 0"? Debido a que estos son los sistemas (o colección de vectores) que producirán el valor propio S = 1 (porque S ^ 2 * spin-1-eigenvector = 2 = S * (S + 1) -> S = 1), y S =0 (porque S^2 * spin-0-eigenvector = 1 = S*(S+1) -> S=0).

Si alguien quiere formatear mejor esta respuesta, adelante.

Realmente no puede derivar cuándo usar la suma directa y cuándo usar el producto tensorial de los cuatro postulados que enumeró, porque esos postulados describen un solo sistema y presuponen la existencia de un espacio de Hilbert. H que describe ese sistema. La naturaleza del espacio de Hilbert generalmente se postula y rara vez se puede derivar sin suposiciones adicionales. Por ejemplo, no hay forma de deducir que un sistema dado de muchas partículas es bosónico o fermiónico (o ninguno), lo cual es fundamentalmente una propiedad del espacio de Hilbert, sin hacer más suposiciones como la invariancia de Lorentz.

Sin embargo, como se discutió en las respuestas a esta pregunta duplicada , la regla de Born funciona mejor con los productos tensoriales que con las sumas directas. Si puede expresar un estado de un sistema como un producto tensorial de otros dos estados, entonces cada uno de esos estados factoriales también cuenta como un "sistema" de acuerdo con los postulados, lo que se ajusta a nuestra noción intuitiva de cómo deberían funcionar los "sistemas". Supongo que dependiendo de su perspectiva filosófica sobre lo que cuenta como un "sistema", esto es una prueba o una fuerte motivación para el producto tensorial como el medio adecuado para combinar "subsistemas".

Pero, para imitar los comentarios de Knzhou, vale la pena señalar que estas preguntas de "por qué" siempre son muy difíciles de responder en la mecánica cuántica. Esto se debe a que muchos resultados de la mecánica cuántica encajan todos juntos de manera muy satisfactoria, pero no es necesariamente obvio cuáles son los más fundamentales:

  • La regla de Born
  • Los subsistemas de los sistemas obedecen las mismas reglas.
  • El hecho de que el producto tensorial sea la forma adecuada de combinar subsistemas
  • El hecho de que los estados físicos correspondan naturalmente a rayos en lugar de vectores en el espacio de Hilbert
  • [Significativamente más profundo en las malas hierbas,] el hecho de que el campo de los escalares es el complejo en lugar de los números reales

La modificación de cualquiera de estos hechos tiende a romper inmediatamente todos los demás, sin dejar de dar como resultado una teoría lógicamente consistente. (El último es un caso especial; se puede modificar dejando los demás intactos, aunque la teoría resultante es posiblemente menos natural). Por lo tanto, es muy difícil responder preguntas de "por qué" en general.

Fue muy difícil tener una idea de lo que realmente significan el "espacio de Hilbert" y los productos tensoriales en la mecánica cuántica.

Personalmente, creo que las explicaciones que se basan en el "formalismo del producto tensorial" son absolutamente peores para la comprensión. Da cero intuición y convierte al alumno en un mono de plug-and-chug.

El concepto que me hizo encajar las cosas es una escritura cuidadosa de lo que representa la función de onda:

La función de onda representa un valor (complejo) que (cuando se eleva al cuadrado) describe la probabilidad de un POSIBLE ESTADO DE SALIDA .

Suena obvio, pero esta es la idea clave: a los estados de salida potenciales se les asignan probabilidades.

Ahora es muy natural ver lo que sucede en muchos estados de partículas:

Si tengo una "moneda cuántica" descrita por el estado Ψ = ( PAG H | H + PAG T | T ) .

Y lanzo dos de estas monedas, ¿cuál es el estado de salida?

Ahora está claro en probabilidad normal que las posibilidades de salida para lanzar dos monedas son:

HH, HT, TH y TT (4 estados de salida)

¡Y esto se duplica por cada moneda que agregamos! Agregando uno más:

HHH, HHT, HTH, HTT, TTT, THT, THH, TTH (8 estados de salida)

Ahora, en el caso cuántico, a cada una de estas posibilidades se le debe asignar su propia amplitud de probabilidad (¡y tiene el potencial de causar interferencia!)

Ahora, si lanzamos dos monedas cuánticas de forma completamente independiente, identificamos que no debería haber ninguna correlación entre las monedas, y debería verse exactamente igual que el caso clásico.

PAG ( H H ) = PAG H PAG H PAG ( H T ) = PAG H PAG T PAG ( T H ) = PAG T PAG H PAG ( T T ) = PAG T PAG T

Ahora hay un operador lineal que tomará dos estados Ψ 1 = ( PAG H | H 1 + PAG T | T 1 ) y Ψ 2 = ( PAG H | H 2 + PAG T | T 2 ) y convertirlos en el espacio de posibilidad combinado correcto que da probabilidades independientes? Ese es el producto tensorial!!

Un producto tensorial se usa para describir estados que son independientes. Y esta es exactamente la razón por la cual el entrelazamiento es si y solo si un estado dado NO PUEDE ser descrito por tal producto tensorial.

Entonces, dando un ejemplo, si tiene algún conjunto de posibilidades de salida como: C 1 | H 1 | H 2 + C 2 | H 1 | T 2 + C 3 | T 1 | H 2 + C 4 | T 1 | T 2

Si no puedes simplificarlo para que pueda ser de la forma ( a | H 1 + b | T 2 ) ( C | H 3 + d | T 4 )

Entonces sabes que tu estado no es "independiente" (y por definición está enredado).

Creo que muchas veces este ejemplo de entrelazamiento se considera separado de lo que representan estos productos tensoriales, y creo que esto es un error: no pude encontrar ningún sentido a estas cosas hasta que finalmente encontré esta línea de pensamiento.

Una nota final: a menudo la gente dice algo como:

Para un estado 1 (existente en H 1 ) y un estado 2 (existente en H 2 ) existe enredo en el espacio H 1 H 2 . Este lenguaje es muy confuso, pero desafortunadamente es común y rara vez se explica. El "espacio de hilbert" H 1 H 2 simplemente representa el conjunto de amplitudes de probabilidad que podrían asignarse al estado de salida de combinación. En nuestro ejemplo, con 2 monedas cuánticas, tendríamos un espacio de H 1 H 2 ( | H 1 + | T 1 ) ( | H 2 + | T 2 ) ( | H 1 | H 2 + | H 1 | T 2 + | T 1 | H 2 + | T 1 | T 2 ) En este caso, estamos usando esta notación más como un "truco" para mezclar nuestros kets de manera que obtengamos el espacio que describe el mayor espacio de posibilidades.