¿Por qué los matemáticos eligieron que el producto interno fuera lineal en el primer argumento en lugar del segundo?

Desde mi experiencia limitada con espacios de productos internos, parece que el producto interno lineal en el segundo argumento facilitaría una notación más fluida. Por ejemplo, para X H , podríamos definir X H por

X y = X , y
Entonces esto generalizaría el hecho de que X T y = X , y en R norte .

¿La linealidad en el primer argumento facilita la notación en algún otro aspecto de la teoría del espacio de Hilbert?

Es solo una convención. Siempre uso la linealidad en el primer componente.
Los productos internos son lineales en ambos argumentos.
@JohnDouma No cuando el campo base es C .
En mi propia experiencia, esto es completamente arbitrario sin una motivación particular, aunque estoy de acuerdo en que la gente de matemáticas tiende a hacer que la primera entrada sea lineal en lugar de la segunda.
Sé que a los mecanicistas cuánticos les gusta su linealidad en el segundo argumento.
Encima C , un producto interno se define como una sesquilinearforma (= 1½ forma lineal) en un espacio vectorial complejo.
En todo caso, y se me puede llamar hereje en algunos círculos por esto, me gusta más la notación física. Muchas veces queremos usar X , como funcional, y siempre ha tenido más sentido para mí que esto sea lineal por defecto. Me interesaría saber por qué otros matemáticos prefieren la convención lineal a la izquierda, además de de dónde proviene históricamente.
tambien en fisica X es un vector, así que mejor tenemos a X + b y = a X + b y ! Seguramente los matemáticos deben estar de acuerdo en que X no puede ser un vector.
@Lars Para un matemático, no es necesario tener el tipo de marcadores "bra-ket" alrededor de un vector, por lo que el hecho de que X | "posiblemente no puede ser un vector" no es un argumento particularmente convincente.
Aquí hay una posibilidad. Cuando Hamilton introdujo los cuaterniones y sus productos escalares, estaba escribiendo | a | 2 = a a ¯ en este orden (usando notación moderna). No importaba para los cuaterniones, ya que conmutan con sus conjugados, pero tal vez la convención se mantuvo cuando los productos internos/escalares se extendieron a vectores complejos.
Un matemático llamado Hilbert definió por primera vez el producto interno alrededor de 1905. Aunque, para ser honesto, creo que este fue el trabajo de von Neumann, quien fue alumno de Hilbert. La convención de Hilbert estaba prácticamente grabada en piedra cuando Dirac definió la notación bra-ket. Entonces, en su mayor parte, los matemáticos han mantenido la convención de Hilbert. Creo que es mejor distinguir entre el espacio y su dual, lo que hace la notación de Dirac. Apenas se estaba formulando el espacio dual cuando Hilbert definió un producto interior.

Respuestas (1)

He enseñado álgebra lineal utilizando ambas convenciones y estoy de acuerdo con su conclusión. Encontré que la convención "física" tiene más ventajas que desventajas cuando se trabaja sobre C (o trabajando simultáneamente sobre F dónde F { R , C } ). Esos incluyen:

  1. Ahora es estándar que los vectores se identifiquen con vectores de columna, mientras que los covectores se identifiquen con vectores de fila. Por lo tanto, el producto interno estándar en R norte se escribe en términos de producto de matriz como X T y (y no se puede escribir como X y T ). Por reemplazo T con , se obtiene un producto interno estándar X y en C norte lo que generaliza el caso real y es naturalmente antilineal en la primera variable. Para describir el producto interno estándar utilizando una convención lineal en la primera variable en vectores de columna, se debe definir X , y = y X que es más incómodo.
  2. El antiisomorfismo de Riesz V V es dado por v v , . Esto es consistente con la idea de que " v actúa sobre algún vector w por v , w y es aún más claro con la notación bra-ket en la que un vector v V define un funcional lineal v | por v | ( w ) := v | w . Esto impone el requisito de que el producto interior sea lineal en la segunda variable.
  3. La expansión de un vector v en base ortonormal ( mi 1 , , mi norte ) se escribe como i = 1 norte mi i , v v que es consistente con la notación de espacio dual i = 1 norte mi i ( v ) v dónde mi i es i -th elemento en la base dual que le da la i -ésima coordenada de un vector.
  4. Los coeficientes matriciales de un operador lineal T con respecto a una base ortonormal mi 1 , , mi norte son dados por a i j = mi i , T ( mi j ) (Opuesto a a i j = T ( mi j ) , mi i que es más incómodo) mientras que el coeficiente de la matriz de T son dados por mi j , T ( mi i ) (Opuesto a T ( mi i ) , mi j ...).

Lo único levemente molesto que noté con la convención "física" es que la propiedad definitoria para el operador adjunto se escribe naturalmente como T v , w = v , T w mientras yo estaba acostumbrado a la forma T v , w = v , T w . Ambas formas son equivalentes pero si se quiere usar el antiisomorfismo de Riesz para justificar la existencia de T , la forma T v , w = v , T w es más natural y lleva algún tiempo acostumbrarse.

¡Gracias por discutir esos puntos!