¿Por qué funciones complejas para explicar la dualidad onda-partícula?

Tengo la muy mala costumbre de ir desde cero, descartar todos los desarrollos de una teoría y conocimiento mundano, y hacer algunas preguntas fundamentales (en su mayoría estúpidas e ingenuas, como dirán algunos) sobre por qué necesitábamos tal y tal suposición, por qué tuvimos que considerar de esta manera, ¿podríamos suponer X en lugar de Y y obtener una teoría diferente y así sucesivamente. Como parte de esto, es la siguiente pregunta:

A principios del siglo XX, los físicos lucharon por explicar ciertos fenómenos como el efecto fotoeléctrico que necesitaba ondas de luz para comportarse como partículas (fotones) y el efecto de interferencia de los electrones (difracción) que necesitaba que se comportaran como ondas.

Así que dijeron, oye, considera una ola (no me preguntes qué es, pero solo considéralo)... ok

Ψ ( X , t ) = mi i ( k X ω t ) ,
ahora sin preguntar que es Ψ , podemos explicar la interferencia de electrones y también el efecto fotoeléctrico, básicamente la dualidad onda/partícula, si hacemos una analogía entre la naturaleza onda y partícula como pag = k , mi = ω .

Mi pregunta aparentemente contundente es, si desea explicar la naturaleza de las ondas y la interferencia considerando una función de onda Ψ , ¿por qué diablos necesitamos números complejos, por qué no solo funciones reales? ¿No podemos considerar algo como Ψ ( X , t ) : R × R R o algo así. Espera, las ondas de agua se explican con éxito mediante la función de onda real, por ejemplo Ψ ( X , t ) = porque ( k X ω t ) Entonces, ¿por qué diablos necesitamos ondas complejas para hacer una analogía de la dualidad onda-partícula? ¿Qué pasa si simplemente olvidamos todo el QM y comenzamos con una función real para las ondas, qué va a pasar?

Perdón por ser un poco presuntuoso, pero algunos caballeros comenzarán a hablar sobre la amplitud de probabilidad, el principio de incertidumbre, etc., pero, caballeros, ¡esperen, no he ido tan lejos! No tengo la interpretación de Born y todavía no tengo el principio de incertidumbre ni la ecuación de Schrödinger, ¡así que su lógica conducirá a argumentos circulares!

Después de todo, nuestro objetivo es explicar el fenómeno físico... ¿Qué pasa si nos aventuramos en esta jungla de funciones reales y encontramos una teoría totalmente diferente que explica el fenómeno físico?

((Si me pides que investigue en física teórica, tiraré todos los libros de QM a la basura (aunque sin ignorarlo) y empezaré a pensar desde este punto de vista... ¡Ese es mi estilo de trabajo!)

Mi respuesta esperada es en este espíritu: "Oye, si vas en esa dirección, seguramente terminarás en arenas movedizas, por tal y tal razón".

@JohnRennie: Mi pregunta es diferente a la de ellos en este sentido, dicen "¿Podemos tener una teoría de la misma física sin números complejos? Si es así, ¿es más fácil la teoría usando números complejos?", Yo digo "¿podemos tener una teoría completamente teoría diferente pero explica el fenómeno existente y aún más"
Las formulaciones complejas permiten colocar bastante más información en la ecuación. No es una cosa de dualidad; solo una forma de obtener fase y amplitud (y sus interacciones) en una representación compacta.
@CarlWitthoft: No estoy preguntando sobre matemáticas, estoy preguntando sobre la posibilidad de una nueva teoría yendo en una dirección completamente diferente.
Los fundadores de QM realmente no tenían una filosofía para empezar, hicieron algo que podía explicar ciertas cosas y luego comenzaron una filosofía, ¿verdad?
Las ondas de agua se pueden medir, pero no la función de onda.
@jinawee: Para empezar, el objetivo es llegar a algo que no podamos medir. ¡Es realmente divertido!
Personalmente, no veo necesariamente por qué la pregunta está siendo rechazada, aunque admito que no tengo una respuesta de por qué un formalismo de valor puramente real no podría cocinarse por algún medio extravagante. Sin embargo, dicho esto, el formalismo actual utilizado para la mecánica cuántica esencialmente abarca todas las observaciones experimentales correctamente. Por lo tanto, si existiera, cualquier formalismo de "valor real" necesariamente sería completamente isomorfo al formalismo actual o estaría en conflicto con la realidad.
rajesh bhai; No sé acerca de la mecánica cuántica, pero el hecho : A porque ( ω t + θ ) = A mi i ( ω t + θ ) + mi i ( ω t + θ ) 2 y A porque ( ω t + θ ) = Re { A mi i ( ω t + θ ) } = Re { A mi i θ mi i ω t } . permite reducir el esfuerzo en los cálculos. Este hecho es común en el análisis de circuitos . El voltaje y la corriente se representan como fasores, después del cálculo, solo se considera la parte real .
@RajeshD: si desea ver si hay otra forma de abordar la teoría de QM (o la filosofía , si lo prefiere), inténtelo . Tal vez encuentres otra manera. Enviar una misiva como esta no servirá.
Consulte este libro en la sección 1.1 Experimento de Stern-Gelach.

Respuestas (4)

Después de todo, nuestro objetivo es explicar el fenómeno físico... ¿Qué pasa si nos aventuramos en esta jungla de funciones reales y encontramos una teoría totalmente diferente que explica el fenómeno físico?

Buena suerte para ti. En primer lugar, está equivocado al decir que la física clásica no usó funciones imaginarias. Las soluciones de las ecuaciones de Maxwell expresadas como funciones imaginarias son más generales y universales que los senos y cosenos.

El conjunto más simple de soluciones a la ecuación de onda resulta de asumir formas de onda sinusoidales de una sola frecuencia en forma separable

mi ( r , t ) = R mi { mi ( r mi i ω t }

Las funciones imaginarias son una herramienta útil en integraciones y descripciones de datos reales.

((Si me pides que investigue en física teórica, tiraré todos los libros de QM a la basura (aunque sin ignorarlo) y empezaré a pensar desde este punto de vista... ¡Ese es mi estilo de trabajo!)

Con tales puntos ciegos, estoy seguro de que nadie le pedirá que investigue en física teórica.

La diferencia entre el uso clásico de funciones imaginarias de las soluciones de las ecuaciones de onda y la mecánica cuántica es el postulado que postula que el cuadrado de la función de onda es real y da la probabilidad de que se observe una interacción de partículas elementales (o nucleares). . Cuando en el microcosmos reina la mecánica cuántica. Allí no se puede tomar una regla, marcarla y medir, se comprobó que las teorías y los datos concordaban cuando se impuso el postulado de probabilidad. Uno tiene que hacer muchas medidas y obtener la distribución de probabilidad para un valor particularmente deseado.

El enlace anterior analiza los postulados de la mecánica cuántica que no fueron impuestos por una imaginación anormal, sino que fueron necesarios para poder calcular y ajustar observaciones conocidas, como el átomo de hidrógeno, y predecir el resultado de experimentos y observaciones.

EDITAR para abordar la última parte de la pregunta:

((Si me pides que investigue en física teórica, tiraré todos los libros de QM a la basura (aunque sin ignorarlo) y empezaré a pensar desde este punto de vista... ¡Ese es mi estilo de trabajo!)

Eso funciona para el arte, el arte depende mucho menos de las bases de datos de las observaciones y de las herramientas que se pueden utilizar.

El hecho de que durante dos mil años la gente haya estado creando modelos de observaciones físicas, y particularmente en los últimos 300 una base de datos de herramientas matemáticas también, limita la creatividad en la ciencia. Las herramientas matemáticas se han utilizado para modelar todas las observaciones hasta ahora. Estos modelos son, en cierto modo, una descripción abreviada de la naturaleza que podría usarse de muchas maneras en lugar de volver a los datos mismos. Existe una frontera de la investigación experimental donde los modelos no han sido validados, y ahí es donde pueden entrar nuevas ideas.

Mi respuesta esperada es en este espíritu: "Oye, si vas en esa dirección, seguramente terminarás en arenas movedizas, por tal y tal razón".

Si vas en la dirección de tirarlo todo terminarás con modelos vagos como el modelo atómico de Demócrito, o la teoría del flogisto, en tus propias palabras. Los modelos matemáticos utilizados ahora están validados, algunos de ellos con gran precisión. Las nuevas herramientas matemáticas para modelar los datos ya modelados solo valdrían la pena si se predice y encuentra algo nuevo e inesperado en los experimentos.

Hay personas trabajando en teorías fuera de lo común, tratando de explicar la mecánica cuántica mediante teorías deterministas subyacentes. Estas personas tienen un conocimiento profundo de las herramientas matemáticas existentes y de los modelos físicos que han sido validados. Solo quieren trabajar en la frontera ignorando que la corriente principal de la física considera que su esfuerzo es contradictorio o imposible/prohibido por los postulados de la mecánica cuántica y la relatividad especial. Un ejemplo son los intereses de investigación actuales de G.'t Hooft, quien también participó aquí hace un tiempo.

Entonces, si vas en esa dirección, seguramente terminarás en arenas movedizas si no tienes un conocimiento profundo de los datos y las herramientas matemáticas utilizadas por la física hasta ahora. Si hace el esfuerzo de adquirirlos, entonces, por supuesto, es libre de demostrar que la física convencional está "equivocada", siempre que su nueva teoría pueda acomodar los datos abreviados de los modelos hasta ahora. Todas las teorías nuevas, tal como aparecían en la física, se unían sin problemas a las antiguas, como casos límite.

Mi pregunta no es sobre el uso de números complejos en la física en general (clásica/moderna o lo que sea). Mi pregunta es muy específica, ¿por qué empezamos con una función compleja para las ondas para explicar la naturaleza onda-partícula? En espíritu, mi pregunta para hablar está dirigida a Debroglie o ¿quién comenzó esto? ....... en otra nota, soy un ingeniero/investigador de procesamiento de señales que trata con números complejos todo el tiempo sin ningún problema.
Nadie le pidió a Einstein que inventara la teoría de la relatividad, lo hizo cuando era empleado de patentes, en sus horas libres.
Las transformaciones de Lorenz existían en las ecuaciones de Maxwell, por eso se llaman de Lorenz y no de Einstein. Su pensamiento innovador, consistente con los datos que estaban reuniendo en ese momento, era usarlo para partículas masivas. No creó de la nada, sino que, como toda física nueva, utilizó pasos anteriores para ir más allá en la explicación de las observaciones.

Creo que las palabras clave aquí son invariancia de cambio de tiempo, flujo , estado, linealidad (u homogeneidad), continuidad y unitaridad, y la respuesta a su pregunta es bastante independiente de si estamos haciendo mecánica cuántica o no.

Supongamos que estamos andando a tientas en la oscuridad tratando de describir algún fenómeno nuevo como lo hacían los primeros físicos (en realidad, en la década de 1920). En la tradición de Laplace, usted espera que una descripción determinista del sistema funcione (y la parte de QM que usa números complejos, es decir, la evolución del estado unitario, es total y absolutamente determinista). Así que vamos a comenzar con un estado : alguna información - una serie de números ψ - reales por ahora si lo desea - eso determinará por completo el futuro (y el pasado) del sistema si el sistema se separa del resto del Universo .

Así que tenemos algunos ψ R norte = X esa es nuestra descripción básica .

Ahora bien, un sistema aislado evoluciona por sí solo: con el transcurso del tiempo el sistema cambia de alguna manera. Dejar φ : X × R X Sea nuestra operación de evolución temporal: para X X φ ( X , t ) X es a lo que evoluciona el estado después de un tiempo t . Además, la descripción no puede depender de cuándo dejamos que suceda: debe tener una invariancia de cambio de tiempo básica. Los resultados del experimento no pueden depender de si lo hago ahora o si espero hasta que me haya tomado mi taza de té. Así que la descripción del cambio en algún intervalo de tiempo Δ t debe ser el mismo que para el cambio en cualquier otro Δ t . Si no estamos interactuando con el sistema, entonces no hay intervalos de tiempo privilegiados. Por lo tanto, debemos tener:

φ ( X , t + s ) = φ ( X , s + t ) = φ ( φ ( X , t ) , s ) = φ ( φ ( X , s ) , t ) , s , t R

y

φ ( X , norte Δ t ) = φ ( φ ( φ ( φ ( norte   iteraciones X , Δ t ) , Δ t ) , Δ t ) norte   iteraciones

entonces, a partir de nuestra noción copernicana de la invariancia del cambio de tiempo , tenemos nuestra próxima gran idea: la de un flujo definido por el operador de transición de estado φ . Así que nuestros operadores de transición de estado forman un grupo continuo de un parámetro. Aquí hemos aplicado nuestra idea fundamental de continuidad .

Puede parecer que esto quiere decir (dado que ahora tenemos un grupo de Lie de un parámetro ) que los únicos sistemas que cumplen estas ideas son los lineales, pero no es así: el grupo de Lie solo actúa sobre X por lo que siempre existe la posibilidad de algún local, X "estiramiento" o "encogimiento" no lineal dependiente del camino. Así que ahora hacemos una suposición de linealidad del sistema o de alguna otra noción de una acción homogénea (de modo que, intuitivamente, φ ( , t ) : X X conserva alguna "estructura" local de nuestro espacio estatal X ). Entonces, el único operador de flujo de transición de estado continuo, lineal y homogéneo en X es:

φ ( X , t ) = Exp ( H t ) X = d mi F ( i d + H t + H 2 t 2 2 ! + H 3 t 3 2 ! + ) X

para algún operador lineal H : X X .

Así que ahora, para investigar el comportamiento de este modelo básico, necesitamos pensar en los valores propios de H , de modo que, por ejemplo, podemos "factorizar espectralmente" el operador ("diagonalizarlo", o al menos acercarnos lo más posible a diagonalizarlo, pero esto siempre se puede hacer en QM). El origen natural de los valores propios de un operador son C , no R , porque el primero es un campo algebraicamente cerrado y el segundo no lo es. Existen operadores lineales de dimensión finita cuyas ecuaciones características tienen soluciones en C R . Además, debemos considerar los comportamientos de mi λ t dónde λ son los valores propios de H (esto es fácil en un espacio de dimensión finita; para uno de dimensión infinita, vea mi respuesta aquí a la pregunta de Physics SE "¿Son todos los estados de dispersión no normalizables?" ) - ¿Cómo encajan estos con nuestra física?

Si, para cualquier valor propio, λ es real y positivo, o si es complejo y su parte real es real y positiva, nuestro vector de estado diverge hasta una longitud infinita como t . Si todos son complejos con una parte real negativa, entonces nuestro vector de estado se reduce rápidamente al vector cero. Incluso antes de que hayamos cristalizado correctamente la idea de la amplitud de probabilidad, podemos tener la idea de que "queremos que la mayor cantidad de estado permanezca el mayor tiempo posible". El sistema debe terminar en algún estado distinto de cero: nuestras partículas no todas colapso al mismo estado 0 X . Entonces, todos los valores propios son completamente imaginarios, de modo que mi λ t tiene una magnitud limitada que no se precipita al infinito oa la nada, podría ser una apuesta justa. Trayendo esto a un enfoque más nítido: tener Exp ( H t ) conservar la longitud podría ser otra suposición razonable. La "longitud" más fácil en el espacio de estados es, por supuesto, la L 2 uno. Entonces, ahora podríamos postular, incluso antes de que nuestras ideas sobre la amplitud de probabilidad en QM estén completamente cristalizadas, que:

El operador Exp ( H t ) es unitario

Esto significa equivalentemente que:

H es sesgado-hermitiano

o que nuestro operador es Exp ( i H ^ t ) dónde:

H ^ es hermitiano

Los operadores hermitianos, dados supuestos muy leves, siempre son diagonalizables y siempre tienen valores propios reales. Entonces entidades como Exp ( i ω t ) dónde ω R son inevitables en nuestras expansiones de operadores de transición estatal.

Ahora tienes razón y podríamos mantener todo real, usa porque y pecado en su lugar y mantener nuestro espacio de estado como R 2 norte donde tendríamos C norte en la descripción convencional. Ya sea que elijamos o no destacar un objeto como:

( 0 1 1 0 ) tu ( 1 ) , S tu ( 2 ) , S O ( 3 ) , tu ( norte )

y darle un símbolo especial i dónde i 2 = 1 es una "cuestión de gustos", por lo que en este sentido el uso de números complejos no es imprescindible. No obstante, todavía necesitaríamos encontrar este objeto al descomponer nuestro operador de transición de estado y H , H ^ operadores y otros como este y tendrían que manejar declaraciones que involucran tales objetos al describir la física; no hay forma de evitar esto. Entonces, en particular, si tenemos un comportamiento de onda acotado, pero eterno, debemos encontrar pares de estados en nuestro R 2 norte representación de lo convencional C norte que evolucionan con el tiempo a través de operadores diferenciales lineales con submatrices como la i objeto de arriba.

Entonces, en realidad ves que los números complejos surgen de manera muy natural a partir de las ideas muy clásicas y, de hecho, del Renacimiento de personas como Laplace, Copérnico, Leibnitz, Galileo y Newton. Simplemente tenemos un lenguaje matemático mejor y más refinado para hablar sin problemas sobre estas ideas en las que estos tipos andaban a tientas en la oscuridad.

Y ahora, si mantenemos la linealidad pero eliminamos la invariancia del cambio de tiempo (digamos que tenemos algún "control" de nuestro operador lineal H ( t ) : podríamos tener un electrón en un campo magnético clásico que podemos variar para "dirigir" el estado del electrón, por ejemplo) todavía obtenemos la mayoría de las ideas anteriores. Por ahora resolvemos:

d t tu ( t ) = H ( t ) tu ( t )

que podemos pensar que tiene algunos diales para girar para dirigir a nuestro miembro de álgebra de Lie H en el espacio tangente en tu al grupo de Lie de operadores de transición de estado. H todavía debe ser sesgado-hermitiano y tu tu ( norte ) (si nuestro sistema es de dimensión finita). Vea mis respuestas aquí a la pregunta de Physics SE "¿Por qué se puede usar la ecuación de Schrödinger con un hamiltoniano dependiente del tiempo?" así como, para un ejemplo práctico, aquí a la pregunta de Physics SE "estado de qubit de entrada fijo a un estado puro arbitrario usando dos rotaciones variables y una rotación fija"

La dualidad onda-partícula es la "prehistoria" de la Mecánica Cuántica. En cuanto a la Mecánica Cuántica, es mucho más interesante observar la representación de Heinsenberg, donde la posición y el momento son operadores que dependen del tiempo, mientras que los estados | ψ No.

Las restricciones cuánticas se expresan mediante relaciones de conmutación:

[ X ( t ) , PAG ( t ) ] | t = t = C o norte s t a norte t     I d

Aquí "Constante" es un valor real o imaginario que no depende de t (en t = t ), y I d es el operador de identidad (que conmuta con todos los operadores)

Ahora, la pregunta es: ¿debemos elegir esta constante como un valor real puro, o un valor imaginario puro?

Porque X ( t ) y PAG ( t ) son operadores hermíticos, su conmutador es antihermitiano, por lo que la única posibilidad matemática es que la constante sea puramente imaginaria:

(1) [ X ( t ) , PAG ( t ) ] | t = t = i     I d

Ahora, podemos volver a la representación de Schrödinger y a la función de onda ψ ( X , t ) = X | ψ ( t )

Con ψ ( X , t ) , debemos encontrar una representación para los operadores X y PAG , que se aplican a ψ ( X , t ) , por lo que ahora estos operarios ya no dependen del tiempo, pero su definición debe ser compatible con sus relaciones de conmutación que se encuentran en ( 1 ) , por lo que la solución más simple es:

PAG = i X

Ahora, imagine una función de onda correspondiente a un momento constante pag y energía mi , entonces necesariamente, debe tener la forma:

ψ ( X , t ) mi i ( pag X mi t ) = mi i ( k X ω t )

Tenemos PAG ψ ( X , t ) = i X ψ ( X , t ) = pag ψ ( X , t )

[El operador de energía mi siendo definido como mi = i t ]

Entonces ves que no puedes "escapar" a la representación imaginaria, parece totalmente natural en el contexto de la Mecánica Cuántica.

Los números complejos son tan reales como los números reales. Llamarlos imaginarios es solo una cosa de nombrar, pero están ahí. En algunas aplicaciones, son una forma abreviada excelente y una manera de evitar toneladas de funciones goniométricas y cálculos "complejos" similares (un gran ejemplo es aplicar la rotación, en lugar de calcular una y otra vez, simplemente se multiplica por un número sincomplejo cos; muy útil en gráficos por computadora). ¿Podrías arreglártelas sin usar números negativos? ¿O un cero? Claro que podrías, simplemente haría todo más complicado. Es solo una forma de ahorrar tiempo y espacio y hacer que todo sea más fácil de expresar y comprender.

Si está tratando los números complejos como algo especial, "no real", está cometiendo el mismo error que cometieron los antiguos y los matemáticos cuando descartaron de manera similar los números negativos, o el cero, o los números irracionales. Está allá. Hace el trabajo. ¿Por qué usamos matrices para expresar una colección de ecuaciones lineales? No tenemos que hacerlo, es simplemente conveniente. ¿Puedes expresar la física newtoniana sin vectores? Claro que puedes, pero ahora has triplicado el número de ecuaciones sin motivo alguno. Si tiene una mejor herramienta o representación para un trabajo, utilícela. Esa es la única manera de mantenerse al día con la creciente complejidad de las cosas que hace. Y no importa si estás hablando de matemáticas, física o programación: el tipo que sigue usando herramientas obsoletas también se vuelve obsoleto.

Con todo, seguro que podría expresar QM sin números complejos. Pero eso no cambiaría los principios subyacentes, solo tendrías una expresión diferente (y en realidad más complicada) de lo mismo.