¿Medida de probabilidad implica mecánica cuántica?

El artículo "Quantum Logic and Probability Theory", de Wilce, tiene lo siguiente en la sección 1.4 :

1.4 La reconstrucción de QM

A partir de la sola premisa de que las “proposiciones experimentales” asociadas a un sistema físico están codificadas por proyecciones en la forma antes indicada, se puede reconstruir el resto del aparato formal de la mecánica cuántica. El primer paso, por supuesto, es el teorema de Gleason, que nos dice que las medidas de probabilidad en L(H) corresponden a operadores de densidad. Queda por recuperar, por ejemplo, la representación de “observables” por operadores autoadjuntos, y la dinámica (evolución unitaria). El primero puede recuperarse con la ayuda del teorema espectral y el segundo con la ayuda de un teorema profundo de E. Wigner sobre la representación proyectiva de grupos. Véase también R. Wright [1980]. En el libro de Varadarajan [1985] se puede encontrar un esquema detallado de esta reconstrucción (que involucra algunas matemáticas claramente no triviales). El punto a tener en cuenta es que, una vez que el esqueleto lógico-cuántico L(H) está en su lugar, el resto del aparato estadístico y dinámico de la mecánica cuántica queda esencialmente fijo. Entonces, en este sentido, la mecánica cuántica —o, en todo caso, su marco matemático— se reduce a la lógica cuántica y su correspondiente teoría de la probabilidad.

Wilce nunca parece definir L(H) explícitamente, pero creo que es probablemente una red L construida sobre el espacio H de Hilbert. El poco conocimiento que tengo de este tipo de cosas proviene de Mackey, Mathematical Foundations of Quantum Mechanics.

Me interesa entender un poco más sobre el resultado o conjunto de resultados a los que se refiere Wilce. Hace referencia a Varadarajan, pero ese es un libro viejo, caro y de dos volúmenes. ¿Alguien puede (a) ampliar la descripción de Wilce en el formato de una respuesta SE, o (b) indicarme referencias que no sean de pago que describan esto con más profundidad que el párrafo único de Wilce, pero sin abarcar un libro completo? No me importa especialmente analizar todos los detalles de las pruebas, que Wilce anuncia como "profundas", pero me gustaría entender un poco más explícitamente qué resultado o resultados se describen y su interpretación.

En cuanto a la lista de suposiciones, ¿es esto aproximadamente correcto?

  • Hay un espacio de Hilbert H (¿probablemente de dimensión 3 o más, como en el teorema de Gleason?) equipado con algún aparato lógico (¿la red L?).

  • Tenemos una medida de probabilidad que satisface los axiomas de Kolmogorov (incluida la aditividad contable, pero sin las connotaciones de la lógica booleana).

  • ¿Necesitamos también asumir alguna forma de la ley de los grandes números?

¿Es lo siguiente algo así como la lista correcta de resultados?

  • La medida de probabilidad se puede describir mediante una matriz de densidad (teorema de Gleason).

  • Los observables deben representarse mediante operadores autoadjuntos.

  • La evolución temporal debe ser unitaria.

Dado que las suposiciones no se refieren ni definen los observables o la evolución del tiempo, parece que debe haber algún "pegamento" adicional que me falta.

Relacionado: ¿El teorema de Gleason implica la regla de Born?

Eché un breve vistazo al libro de Vardarajan La geometría de la mecánica cuántica hace algún tiempo y recuerdo que usó redes orto-modulares .

Respuestas (2)

Hay un espacio de Hilbert H (¿probablemente de dimensión 3 o más, como en el teorema de Gleason?) equipado con algún aparato lógico (¿la red L?).

Correcto, y la red L ( H ) es el de los proyectores ortogonales/subespacios cerrados de un espacio de Hilbert complejo separable H . Como conjunto parcialmente ordenado, la ordenación parcial PAGS q relación es la inclusión de subespacios: PAGS ( H ) q ( H ) .

Como consecuencia PAGS q := sorber { PAGS , q } es el proyector sobre el cierre de la suma de PAGS ( H ) y q ( H ) y PAGS q := inf { PAGS , q } es el proyector sobre la intersección de dichos subespacios cerrados.

Esta red resulta ser ortomodular, acotada, atómica, satisfaciendo la ley de cobertura, separable, ( σ -)completo.

Tampoco es necesario suponer que la red de proposiciones elementales de un sistema cuántico es L ( H ) desde cero, pero puedes probarlo , asumiendo algunas hipótesis generales (las que escribí anteriormente junto con algunos requisitos técnicos adicionales). Sin embargo, lo que eventualmente encuentra es que el espacio de Hilbert puede ser real, complejo o cuaterniónico. Este resultado lo obtuvo Solèr en 1995.

Tenemos una medida de probabilidad que satisface los axiomas de Kolmogorov (incluida la aditividad contable, pero sin las connotaciones de la lógica booleana).

Correcto. La red es (ortocomplementada y) ortomodular ( A = B ( A B ) si B A ) en lugar de (ortocomplementado y) booleano ( y son mutuamente distributivos).

Sin embargo, la historia es mucho más larga. los elementos de L ( H ) se interpretan como las proposiciones/observables elementales de un sistema cuántico, admitiendo únicamente los resultados SÍ y NO bajo medida.

En una red ortomodular, dos elementos PAGS , q se dice que conmutan si la subred más pequeña que los incluye a ambos es booleana.

Es posible probar que, para la red de proyectores ortogonales L ( H ) , un par de elementos PAGS y q conmutan si y solo si conmutan como operadores : PAGS q = q PAGS .

A posteriori , esto es consistente con la idea de que estos observables elementales pueden medirse simultáneamente.

Si PAGS y q en L ( H ) viaje, resulta que

(*) PAGS q = PAGS q = q PAGS
y
(**) PAGS q = PAGS + q PAGS q .

Un punto crucial es el siguiente. Tener una subred booleana (es decir, hecha de elementos que se conmutan mutuamente) y puede equiparse con el significado lógico estándar de OR y AND respectivamente. el ortogonal PAGS = yo PAGS corresponde a la negación NOT PAGS .

Esta es una forma de recuperar parcialmente la lógica clásica de la lógica cuántica.

¿Necesitamos también asumir alguna forma de la ley de los grandes números?

En realidad, al menos cuando realiza mediciones de observables, siempre reduce a una subálgebra booleana donde la medida de probabilidad se convierte en un estándar σ -medida aditiva de un σ -álgebra y aquí puede asumir resultados estándar sobre la relación entre probabilidades - frecuencias.

¿Es lo siguiente algo así como la lista correcta de resultados?

La medida de probabilidad se puede describir mediante una matriz de densidad (teorema de Gleason).

Sí, siempre que el espacio de Hilbert sea separable con dimensión 2 .

En particular, los elementos extremos del conjunto convexo de medidas de probabilidad de Gleason (las medidas de probabilidad que no se pueden descomponer en combinaciones convexas no triviales) resultan ser de la forma | ψ ψ | para cada posible ψ H con norma unitaria. De esta forma, las medidas extremas coinciden con los estados puros , es decir, los vectores unitarios con las fases.

Los observables deben representarse mediante operadores autoadjuntos.

Sí, esto es sencillo de probar si uno comienza asumiendo que un observable A es una colección { PAGS ( A ) ( mi ) } mi B ( R ) de elementos de la red L ( H ) , es decir, proyectores PAGS ( mi ) dónde mi R es cualquier conjunto real de Borel.

El significado físico de PAGS ( A ) ( mi ) es "el resultado de la medición de A se encuentra en (o es) mi ".

Evidentemente PAGS ( A ) ( mi ) y PAGS ( A ) ( mi ) conmutar y dar el significado estándar a (= Y), tenemos de (*) que

(1) PAGS ( A ) ( mi ) PAGS ( A ) ( F ) = PAGS ( A ) ( mi ) PAGS ( A ) ( F ) = PAGS ( A ) ( mi F ) .

Usando la completitud, no es difícil justificar también la propiedad

i PAGS ( A ) ( mi i ) = PAGS ( A ) ( i mi i )
donde el mi i y una clase finita o numerable de conjuntos de Borel disjuntos por pares. Este requisito, haciendo uso en particular de (**), es matemáticamente equivalente a
(2) i PAGS ( A ) ( mi i ) = PAGS ( A ) ( i mi i )
donde el mi i y una clase finita o numerable de conjuntos de Borel disjuntos por pares y la suma se calcula en la topología de operador fuerte.

Finalmente, dado que algún resultado debe medirse en R , concluimos que

(3) PAGS ( A ) ( R ) = yo ,
porque el proyector trivial yo L ( H ) satisface m ( yo ) = 1 para cada estado de Gleason.

Las propiedades (1), (2) y (3) dicen que { PAGS ( A ) ( mi ) } mi B ( R ) es una medida de valor de proyección (PVM) de modo que el operador autoadjunto

A = R λ PAGS ( A ) ( λ )
existe

El teorema espectral demuestra que la correspondencia entre observables y operadores autoadjuntos es uno a uno.

Dado un estado puro representado por el vector unitario hasta fases ψ y un PVM { PAGS ( A ) ( mi ) } mi B ( R ) describiendo el operador observable/auto-adjunto A , el mapa

B ( R ) mi m ψ ( A ) ( mi ) := t r ( | ψ ψ | PAGS ( A ) ( mi ) ) = ψ | PAGS ( A ) ( mi ) ψ
es una medida de probabilidad estándar sobre σ ( A ) , y los resultados estándar de QM surgen así ( ψ se supone que pertenece al dominio de A )
ψ | A ψ = σ ( A ) λ d m ( A ) ( λ ) ,
justificando la interpretación del lado izquierdo como valor esperado de A en el estado representado por ψ , y así.

También resulta que el soporte de un PVM coincide con el espectro σ ( A ) del observable asociado.

Los elementos PAGS de L ( H ) son operadores autoadjuntos y, por lo tanto, la imagen es consistente: PAGS es un observable elemental que admite solo dos valores 0 (NO) y 1 (SÍ). En realidad { 0 , 1 } = σ ( PAGS ) a menos que se consideren los dos casos triviales (la contradicción) PAGS = 0 dónde σ ( PAGS ) = { 0 } y PAGS = yo (la tautología) donde σ ( PAGS ) = { 1 } .

La evolución temporal debe ser unitaria.

Aquí hay que introducir la noción de simetría y simetría continua .

Hay al menos 3 posibilidades que son equivalentes en L ( H ) , uno es el conocido teorema de Wigner . La más natural, en esta imagen, es sin embargo la debida a Kadison (una de las dos versiones posibles): una simetría puede definirse como un isomorfismo de la red L ( H ) , h : L ( H ) L ( H ) .

Resulta que (teorema de Kadison) los isomorfismos son todos de la forma

L ( H ) PAGS h ( PAGS ) = tu PAGS tu 1
para algún operador unitario o antiunitario tu , definida hasta una fase, y dependiendo del isomorfismo h .

La homogeneidad temporal significa que no hay un origen preferido del tiempo y que todos los instantes de tiempo son físicamente equivalentes.

Entonces, en presencia de homogeneidad de tiempo, debe haber una relación entre la física en el tiempo 0 y la física a la vez t conservación de las estructuras físicas. Forma de evolución temporal 0 a t por lo tanto, debe implementarse mediante un isomorfismo h t de L ( H ) .

Dado que no existe un origen del tiempo, también es natural suponer que h t h s = h t + s .

Por lo tanto, es natural suponer que, en presencia de homogeneidad temporal , la evolución temporal está representada por un grupo de un parámetro de tales automorfismos R t h t . (Grupo de un parámetro significa h t h s = h t + s y h 0 = i d .)

También es natural asumir una hipótesis de continuidad relacionada con posibles medidas y estados:

R t m ( h t ( PAGS ) )

es continua para cada PAGS L ( H ) y cada estado de Gleason m .

Observe que el teorema de Kadison asocia un unitario tu t a cada h t hasta fases , por lo que no hay razón, a priori , para tener tu t tu s = tu t + s , ya que las fases dependen de s y t puede aparecer.

Incluso si uno es tan inteligente como para arreglar las fases para probar la regla de composición de un grupo de operadores unitarios de un parámetro tu t tu s = tu t + s y tu 0 = yo , no hay una razón prioritaria para encontrar un mapa continuo t tu t en alguna topología de operadores naturales.

En realidad bajo dichas hipótesis sobre { h t } t R , es posible probar que (el ejemplo más simple de aplicación del teorema de Bargmann desde el segundo grupo co-homoloy de R es trivial) las fases en la correspondencia h t tu t a través del teorema de Kadison se puede acomodar sin ambigüedades para que h t ( PAGS ) = tu t PAGS tu t 1 dónde

R t tu t
es un grupo de operadores unitarios de un parámetro fuertemente continuo .

El teorema de Stone implica inmediatamente que tu t = mi i t H para algún operador autoadjunto H (definido hasta una constante aditiva en vista de la arbitrariedad de la fase de tu t ).

Este procedimiento se extendió a otros grupos de operadores unitarios de un parámetro mi i s A describir simetrías continuas da lugar a la conocida versión cuántica del teorema de Noether. La simetría continua preserva la evolución temporal, es decir,

mi i s A mi i t H = mi i t H mi i s A
para todos t , s R , si y solo si el observable A generando la simetría continua es una constante de movimiento:
mi i t H A mi i t H = A .

Wow, qué maravillosa respuesta. ¡Gracias por tomarte el tiempo de escribir esto!
Este es un resumen imposiblemente breve de parte de mi libro de 950 páginas sobre teoría espectral y mecánica cuántica (2ª edición) impreso (debería estar listo el 6 de enero de 2018). springer.com/gp/book/9783319707051
Estoy un poco preocupado. Sabemos que hay medidas con valor de proyección (p. ej., en el espín) que no están representadas por un operador autoadjunto (excepto si elevamos el espacio a través de un teorema de Naimark). Una lectura superficial de su respuesta parece descartar esto (o que el espacio de Hilbert del giro 1/2 debería ser mayor que 2). Bueno, leeré el libro de todos modos.

Podría valer la pena señalar que el

El ejemplo canónico son las redes de Hilbert que interpretan la lógica cuántica de Birkhoff-vonNeumann.

pero también

Más tarde se propuso... que una mejor manera de pensar en las redes cuánticas BvN es como las proposiciones en lógica lineal , la lógica categórica de categorías monoidales simétricas.

La lógica lineal es la lógica de los recursos. Y también

También está la propuesta... de que la lógica cuántica debe entenderse como la lógica interna de los topos de Bohr.

esto es

un topos asociado con cualquier sistema mecánico cuántico que es tal que los observables y los estados del sistema físico están codificados de forma más o menos natural en la lógica interna del topos.