¿Qué significan las matrices de Pauli?

Todas las introducciones que he encontrado a las matrices de Pauli hasta ahora simplemente las exponen y luego comienzan a usarlas. Las descripciones adjuntas de su significado parecen frustrantemente incompletas; Yo, al menos, no puedo entender las matrices de Pauli después de leerlas.

Mi comprensión y confusión actuales se demuestran a continuación. Estaría muy agradecido si alguien pudiera llenar todos los agujeros o hacer otros nuevos cuando sea apropiado.

Spinors se ve como vectores de columna, es decir

s = ( 1 0 1 )
y se usan para que la rotación en tres dimensiones (usando números complejos) se pueda transformar linealmente. ¿Qué significa el espinor de ejemplo anterior? ¿Un valor de giro de 1 en las direcciones x y z? ¿Cómo puede girar- 1 2 ser representado con solo 1 entonces?

Se utiliza un vector tridimensional para construir la matriz de Pauli para cada dimensión. Por ejemplo, para girar- 1 2 , los vectores utilizados para x, y y z son v X = ( 1 , 0 , 0 ) , v y = ( 0 , 1 , 0 ) y v z = ( 0 , 0 , 1 ) . Los transforma cada uno a la matriz de Pauli relevante mediante la siguiente ecuación, usando la dimensión x para la demostración,

PAGS X = ( v 3 X v 1 X i v 2 X v 1 X + i v 2 X v 3 X )
donde el superíndice denota dimensión, no poder.

Una vez que tienes estas matrices, operas en los espinores con ellas. ¿Qué hace esto?

También puede encontrar los valores propios y los vectores propios de la matriz, que se pueden usar para encontrar la probabilidad de que una partícula, si se mide para tener un giro determinado en una dimensión, cuando se mida a continuación, tenga un giro en otra dimensión que elija. No entiendo cómo funciona esto. ¿Qué representan físicamente el valor propio y el vector propio en este sentido, y cómo encaja el giro hacia arriba y hacia abajo en esto? Por ejemplo, si tuviera una partícula de espín 1 que supiera que está girando hacia arriba en la dirección x, ¿qué haría para encontrar la probabilidad de que tenga un giro hacia arriba o hacia abajo en la dimensión z o y la próxima vez que la mida?

Los ejemplos concretos probablemente ayudarían mucho a mi comprensión.

¿Es este el entendimiento correcto? Pauli[x]=Voltear el giro en el eje x en la base z (una matriz de rotación - intercambiar valores) Pauli[y]=Voltear el giro en el eje y en la base z Pauli[z]=Voltear el giro en el eje z en la base z (voltear matriz: Spin + es positivo, Spin - es negativo)

Respuestas (4)

Permítame primero recordarle (o tal vez presentarle) un par de aspectos de la mecánica cuántica en general como modelo para los sistemas físicos. Me parece que muchas de sus preguntas pueden responderse con una mejor comprensión de estos aspectos generales seguidos de una apelación a cómo los sistemas de espín emergen como un caso especial.

Observaciones generales sobre estados cuánticos y medición.

El estado de un sistema cuántico se modela como un elemento de longitud unitaria | ψ de un espacio de Hilbert complejo H , un tipo especial de espacio vectorial con un producto interno. Cada cantidad observable (como el impulso o el espín) asociada con un sistema de este tipo cuyo valor uno podría querer medir está representada por un operador autoadjunto O en ese espacio. Si uno construye un dispositivo para medir tal observable, y si uno usa ese dispositivo para hacer una medición de ese observable en el sistema, entonces la máquina generará un valor propio λ de ese observable. Además, si el sistema está en un estado | ψ , entonces la probabilidad de que el resultado de medir esa cantidad sea el valor propio del observable es

pags ( λ ) = | λ | ψ | 2
dónde | λ es el vector propio normalizado correspondiente al valor propio λ .

Especialización en sistemas de hilado.

Supongamos ahora que el sistema que estamos considerando consiste en el espín de una partícula. El espacio de Hilbert que modela el estado de espín de un sistema con espín s es un 2 s + 1 espacio dimensional de Hilbert. Los elementos de este espacio vectorial a menudo se denominan "espinores", pero no dejes que esto te distraiga, son como cualquier otro vector en un espacio de Hilbert cuyo trabajo es modelar el estado cuántico del sistema.

Los observables primarios cuya medida se suele discutir para los sistemas de espín son los componentes cartesianos del espín del sistema. En otras palabras, hay tres operadores autoadjuntos llamados convencionalmente S X , S y , S z cuyos valores propios son los valores posibles que uno podría obtener si uno mide uno de estos componentes del giro del sistema. El espectro (conjunto de valores propios) de cada uno de estos operadores es el mismo. Para un sistema de giro s , cada uno de sus espectros consta de los siguientes valores:

σ ( S i ) = { metro i | metro i = s , s + 1 , , s 1 , s }
donde en mi notación i = X , y , z . Entonces, por ejemplo, si construyes una máquina para medir la z componente del espín de un espín 1 sistema, entonces la máquina producirá uno de los valores en el conjunto { , 0 , } cada vez. En correspondencia con cada uno de estos valores propios, cada operador de componente de espín tiene un vector propio normalizado | S i , metro i . Como se indica en las observaciones generales anteriores, si el estado del sistema es | ψ , y se quiere saber la probabilidad de que la medida del componente de espín S i dará un cierto valor metro i , entonces uno simplemente calcula
| S i , metro i | ψ | 2 .
Por ejemplo, si el sistema tiene spin- 1 , y si se quiere saber la probabilidad de que una medida de S y dará el valor propio , entonces se calcula
| S y , 1 | ψ | 2

Espinores.

En el contexto anterior, los espinores son simplemente las representaciones matriciales de estados de un sistema de espín particular en una cierta base ordenada, y las matrices de espín de Pauli son, hasta una normalización, las representaciones matriciales de los operadores de componentes de espín en esa base específicamente para un sistema con spin- 1 / 2 . Las representaciones matriciales a menudo facilitan el cálculo y la comprensión conceptual, razón por la cual las usamos.

Más explícitamente, supongamos que uno considera un spin- 1 / 2 sistema, y ​​uno elige representar estados y observables en la base B = ( | S z , 1 / 2 , | S z , 1 / 2 ) que consta de los vectores propios normalizados de la z componente de espín, entonces uno encontraría las siguientes representaciones matriciales en esa base

[ S X ] B = 2 ( 0 1 1 0 ) = 2 σ X [ S y ] B = 2 ( 0 i i 0 ) = 2 σ y [ S z ] B = 2 ( 1 0 0 1 ) = 2 σ z
Nótese que estas representaciones son precisamente las matrices de Pauli hasta el extra / 2 factor. Además, cada estado del sistema estaría representado por un 2 × 1 matriz, o "espinor"
[ | ψ ] B = ( a b ) .
Y uno podría usar estas representaciones para realizar los cálculos mencionados anteriormente.

Muchísimas gracias; esto me ayudó mucho a entender. ¿Es solo una convención que los autoestados que devuelven autovalores negativos sean giro 'abajo' y giro positivo 'arriba'? Para verificar mi comprensión, traté de calcular el ejemplo que usé anteriormente: ¿es cierto que una partícula de espín 1 medida para estar arriba en la dimensión x (valor propio hbar) estará en el estado normalizado <1/2, sqrt? (2)/2, 1/2>, y la probabilidad de que la medición de la dimensión z vuelva hacia arriba será 1/4, el giro cero será 1/2 y el 1/4 hacia abajo.
+1 Me gustan especialmente tus "máquinas" en el primer párrafo, con un sabor muy feynmaniano. Luché durante muchos años para "entender" QM: las matemáticas y la teoría de la mentira me eran familiares, pero me tomó mucho tiempo entender que los "operadores" no solo eran operadores, sino que también venían con una receta especial sobre cómo interpretarlos como modelos de "máquinas de medición". Lamentablemente, no puedo recordar si fueron las conferencias de Feynman o Sakurai las que transmitieron el mensaje, o si de hecho fue una mezcla de los dos en mis pensamientos en la ducha o mientras caminaba, pero esto es lo que recomiendo a la gente ahora. .

Los grupos son estructuras matemáticas abstractas, definidas por su topología (en el caso de grupos continuos (Lie)) y la operación de multiplicación.

Pero es casi imposible hablar de grupos abstractos. Es por eso que generalmente los elementos de los grupos se asignan a operadores lineales que actúan en algún espacio vectorial V :

gramo GRAMO ρ ( gramo ) Final ( V ) ,

donde G es el grupo, Final ( V ) significa endomorfismos (operadores lineales) en V , y ρ ( gramo ) es el mapeo. Para que este mapeo sea significativo, tenemos que mapear la multiplicación de grupos correctamente:

ρ ( gramo 1 gramo 2 ) = ρ ( gramo 1 ) ρ ( gramo 2 ) .

La inversa también se asigna a

ρ ( gramo 1 ) = ρ ( gramo ) 1

y la identidad del grupo es solo

ρ ( mi ) = Identificación V .

Esto se llama la representación del grupo. GRAMO . V se transforma bajo la representación ρ de grupo GRAMO .

En su caso, el grupo de interés es el grupo de rotaciones en 3 dimensiones que generalmente se denota como SO(3). Nuestro objetivo es encontrar diferentes objetos que se puedan rotar, es decir, representaciones (y espacios de representación) de SO(3).

Una de esas representaciones es la representación definitoria (que se usa para definir SO(3)) o la representación vectorial. En este caso V es solo R 3 y matrices de ρ ( SO(3) ) son ortogonales 3 × 3 matrices con determinante unitario:

A T A = 1 ; det A = 1

Entonces los vectores se pueden rotar en 3 dimensiones. El resultado de tal rotación por gramo SO(3) se determina actuando sobre el vector inicial con el operador ρ ( gramo ) .

Otra representación es la representación del espinor. El espacio vectorial ahora es bidimensional y complejo . La imagen de esta representación consiste en unitarias 2 × 2 con determinante unitario:

A A = 1 ; det A = 1.

Esta representación no es tan obvia como la anterior, ya que los espinores son algo que no solemos ver en la vida cotidiana. Pero se puede demostrar matemáticamente que estas representaciones son isomorfas y por lo tanto son dos representaciones diferentes del mismo grupo (en realidad son homomorfas y la representación espinora es la doble tapa de la representación vectorial).

Ahora a las matrices de Pauli. Hay un principio general: para cada grupo de Lie GRAMO existe un espacio lineal correspondiente (álgebra de Lie) con un corchete de Lie (una operación anticonmutativa que satisface la identidad de Jacobi) que se mapea de manera única en algún vecindario de la unidad de grupo de GRAMO . Este mapeo se llama exponencial.

Entonces puede escribir un arbitrario (lo suficientemente cerca de la unidad para evitar problemas topológicos globales) 2 × 2 matriz compleja de la representación del espinor en forma

A = Exp [ i 2 α a σ a ] ,

dónde α a son tres números que parametrizan el elemento del grupo cuya representación es A , y i 2 σ a son la base del álgebra de Lie, con σ a - 3 2 × 2 Matrices de Pauli. Esta ecuación especifica en gran medida cómo se transforma un espinor bajo una rotación arbitraria.

En la representación vectorial también existe una base de álgebra de Lie, que consta de 3 3 × 3 matrices.

Hay otras dos interpretaciones de las matrices de Pauli que pueden resultarle útiles, aunque solo después de comprender la excelente descripción física de JoshPhysics . Lo siguiente se puede tomar más como "trivia funky" (al menos yo los encuentro interesantes) sobre las matrices de Pauli en lugar de una interpretación física.

1. Como base para s tu ( 2 )

La primera interpretación se ve de diversas formas como (i) son cuaterniones unitarios, módulo un cambio de signo y reordenación de la definición matemática de estas bestias , (ii) como base para el álgebra de Lie s tu ( 2 ) de S tu ( 2 ) cuando usamos la matriz exponencial para recuperar el grupo S tu ( 2 ) = Exp ( s tu ( 2 ) ) a través de (iii) una generalización tridimensional del teorema de De Moivre .

Un general, sin rastro, 2 × 2 matriz hermitiana sesgada H se puede descomponer de forma única como:

(1) H = α X σ X + α y σ y + α z σ z

con α X , α y , α z R . Esta matriz cumple la ecuación característica H 2 = θ 2 4 i d , dónde i d es el 2 × 2 identidad y θ 2 = α X 2 + α y 2 + α z 2 . Entonces, si desplegamos la serie de Taylor exponencial de matriz universalmente convergente, y luego reducimos todas las potencias de H mayor que el término lineal con la ecuación característica, obtenemos:

(2) Exp ( H ) = porque ( θ 2 ) i d + H ^ pecado ( θ 2 )

que se ve como una generalización de la fórmula de De Moivre para la unidad "imaginaria pura"

(3) H ^ = α X σ X + α y σ y + α z σ z α X 2 + α y 2 + α z 2

y todos los miembros de S tu ( 2 ) se puede realizar mediante una exponencial como en (2) (pero tenga en cuenta que la exponencial de un álgebra de Lie, aunque la totalidad de S tu ( 2 ) en este caso, no es siempre todo el grupo de Lie a menos que este último sea (i) conectado y (ii) compacto). Así cada miembro de S tu ( 2 ) se puede descomponer como una "superposición de longitud unitaria de las matrices de Pauli y la matriz identidad".

La razón del factor 2 en la definición θ / 2 es hasta ahora misterioso: sea testigo de que, a los efectos de lo anterior, podríamos haber reemplazado fácilmente θ / 2 por θ . La razón está relacionada con la relación entre las matrices de Pauli y la esfera Celeste, de la que hablaré más adelante. Los cuaterniones representan rotaciones a través de un mapa de spinor ( PERO , como aconseja Joshphysics, no se distraiga demasiado con esta palabra); si un vector en el espacio tridimensional está representado por un cuaternión puramente imaginario de la forma X σ X + y σ y + z σ z , entonces su imagen bajo una rotación de ángulo θ sobre un eje con cosenos directores γ X , γ y , γ z es dado por:

(4) X σ X + y σ y + z σ z tu ( X σ X + y σ y + z σ z ) tu ; tu = Exp ( θ 2 ( γ X σ X + γ y σ y + γ z σ z ) )

Este mapa de spinor es un ejemplo del grupo S tu ( 2 ) actuando sobre su propio álgebra de Lie a través de la representación adjunta. Se puede entender intuitivamente en términos de una regla de triángulo para calcular las composiciones de dos rotaciones, como se muestra en mi diagrama a continuación. Los arcos en la esfera unitaria representan una rotación en un ángulo dos veces mayor que el dado por el ángulo subtendido por el arco en el origen.

Composición de rotación

Explico esto en detalle en el Ejemplo 1.4 " 2 × 2 Grupo Unitario S tu ( 2 ) " en mi página web "Algunos ejemplos de grupos de mentiras conectados" aquí .

También está mi demostración interactiva de Mathematica "La S tu ( 2 ) Spinor Map: Rotation Composition by Graphical Quaternion Triangles" en el sitio de demostraciones de Wolfram .

2. La Esfera Celeste

Al expandir el espacio lineal tridimensional de superposiciones de matrices de Pauli (que es lo mismo que el espacio lineal de 2 × 2 matrices sesgadas-hermitianas) al espacio de 4 dimensiones abarcado por las matrices de Pauli y las matrices de identidad, entonces cualquier transformación del grupo S L ( 2 , C ) actúa sobre vectores de la forma t i d + X σ X + y σ y + z σ z por el mismo mapa de spinor que en (4). Si nos restringimos a los rayos proyectivos en este espacio, el grupo S L ( 2 , C ) , isomorfa al grupo de Moebius de las transformaciones de Möbius actúa sobre este espacio de rayos exactamente de la misma manera que las transformaciones de Möbius (lineales fraccionarias) actúan sobre la esfera de Riemann. S L ( 2 , C ) es una portada doble del grupo Lorentz, y puedes calcular cómo cambia la vista de un viajero espacial a medida que experimenta las transformaciones de Lorentz. Consulte la sección "Transformaciones de Lorentz" en la página "Transformación de Möbius" de Wikipedia para obtener más detalles.

Una explicación mecánica general. Los campos y las ondas siguen ecuaciones hiperbólicas (ecuaciones de onda). Estos representan un avance en el espacio y el tiempo, y como tales no pueden representar una masa que deba estar estacionaria, sino que también podría estar girando. Tal movimiento necesita una ecuación elíptica. Como ejemplo, la ecuación de Kline-Gordon es hiperbólica, mientras que la ecuación de Dirac es elíptica. En un fluir de fluidos hay un ejemplo paralelo. Los vórtices y la turbulencia no se pueden formar sin la ayuda de un límite para desviar el flujo del avance al estado de circulación. La primera región es hiperbólica y la segunda es elíptica.

Ahora, para crear una partícula (energía giratoria) a partir de un campo (moviéndose en posición), necesitamos desviar/rotar la dirección del campo. Aquí es donde las matrices de Pauli vienen en busca de ayuda y dan la elipticidad requerida. Esta es la razón por la que se utilizan números/rotación imaginarios. Multiplicar una cantidad por i la rota 90 grados, para un ángulo general usamos la exponencial de una cantidad imaginaria.

Más tarde, cuando mezclamos los Lagrangianos de ondas y partículas en un modelo más general, volvemos al uso del Higgs para hacer el mismo trabajo de transformación de un tipo de energía a otro, es decir, de campos a partículas y viceversa.