Definición de los físicos de vectores basada en leyes de transformación.

En primer lugar, quiero dejar en claro que, aunque ya hice una pregunta relacionada aquí , mi punto en esta nueva pregunta es un poco diferente. En la pregunta anterior, he considerado campos vectoriales en una variedad suave y aquí estoy considerando solo vectores.

En Física, los vectores casi siempre se definen por sus propiedades de transformación. Citando a Griffiths:

Bueno, qué tal esto: Tenemos un barril de fruta que contiene norte X peras, norte y manzanas y norte z plátanos Es norte = norte X X ^ + norte y y ^ + norte z z ^ un vector? Tiene tres componentes, y cuando le agregas otro barril con METRO X peras, METRO y manzanas y METRO z plátanos el resultado es ( norte X + METRO X ) peras, ( norte y + METRO y ) manzanas, ( norte z + METRO z ) plátanos Entonces agrega como un vector. Sin embargo, obviamente no es un vector, en el sentido físico de la palabra, porque en realidad no tiene una dirección. ¿Qué es exactamente lo que está mal con eso?

la respuesta es que norte no se transforma correctamente cuando cambias de coordenadas. El marco de coordenadas que usamos para describir posiciones en el espacio es, por supuesto, completamente arbitrario, pero existe una ley de transformación geométrica específica para convertir componentes vectoriales de un marco a otro. Supongamos, por ejemplo, que el X ¯ , y ¯ , z ¯ el sistema gira un ángulo ϕ , relativo a X , y , z , sobre lo común X = X ¯ hachas De la figura 1.15,

A y = A porque θ , A z = A pecado θ ,

mientras

A ¯ y = porque ϕ A y + pecado ϕ A z ,

A ¯ z = pecado ϕ A y + porque ϕ A z .

Más generalmente, para la totalización sobre un eje arbitrario en tres dimensiones, la ley de transformación toma la forma:

A ¯ i = j = 1 3 R i j A j .

Ahora: Haz los componentes de norte transformar de esta manera? Por supuesto que no, no importa qué coordenadas uses para representar la posición en el espacio, todavía hay la misma cantidad de manzanas en el barril. No puede convertir una pera en un plátano eligiendo un conjunto diferente de ejes, pero puede convertir A X en A ¯ y . Entonces, formalmente, un vector es cualquier conjunto de tres componentes que se transforma de la misma manera que un desplazamiento cuando cambias de coordenadas .

Es exactamente este tipo de definición lo que tengo problemas para entender. Mi punto aquí es el siguiente: como diría un matemático, un vector es solo un elemento de un espacio vectorial.

Dejar V ser un espacio vectorial sobre k y deja { mi i } ser una base. Entonces el mapeo F : k norte V dada por F ( a 1 , , a norte ) = a i mi i es un isomorfismo por definición de base.

Esto significa que podemos elegir cualquier número a 1 , , a norte y darán un vector único sin importar cuáles sean esos números. Si representan números de perlas, plátanos o manzanas, no importa. son numeros

Ahora, si consideramos otra base { mi ¯ i } estamos seguros de que existen números a j i que son únicos tales que mi j = a j i mi ¯ i .

En ese escenario si tenemos un vector v = v j mi j entonces nosotros tenemos v = v j a j i mi ¯ i . En otras palabras v = v ¯ i mi ¯ i con v ¯ i = a j i v j . ¡La ley de transformación es, por lo tanto, solo un resultado de la teoría del álgebra lineal !

Ahora, toda mi duda es: ¿qué hay detrás de esta definición de los físicos? Están tratando de usar un resultado de la teoría para definir vectores, pero ¿por qué esta definición debería tener sentido? Como he señalado, porque F es isomorfismo, por la definición de base, cualquier conjunto de números formará un vector y si cambiamos la base, los nuevos componentes cambiarán con fuerza según sea necesario para que la teoría tenga sentido .

EDITAR: Después de pensar por un tiempo, creo que tengo una idea de lo que está pasando aquí. Creo que tenemos dos cosas separadas: la idea matemática de vector y la idea física de cantidad vectorial.

Creo que esa es la fuente de la confusión ya que para un matemático cuando elegimos ( a 1 , , a norte ) k norte esos son solo números arbitrarios, mientras que para un físico si elegimos ( a 1 , , a norte ) cada a i tiene un significado físico específico como una cantidad medible. ¿Es esa la idea de alguna manera?

"¿Por qué los físicos insisten en definir vectores como este?" se basa principalmente en la opinión y tiene tanto que ver con la historia como con la práctica.
Consulte esta pregunta sobre Historia de la ciencia y las matemáticas para una pregunta que establece de pasada que "como una tupel que se transforma de cierta manera" es en realidad la versión más antigua de definir un vector tangente a una variedad.
Tal vez hice una mala elección de palabras. He eliminado esta parte de la pregunta. Lo que quise decir con esto es: ¿cuál es la intuición detrás de esta definición? porque hasta donde tenemos R 3 ya tenemos vectores, esta definición parece no ser realmente necesaria.
Creo que "cuál es la intuición detrás de esto" todavía no es una pregunta objetiva. Es una de las formas equivalentes de definir un vector. Preguntar por qué uno elige una forma equivalente sobre otra no es objetivamente respondible.
No estoy preguntando por qué elegir esta definición en lugar de otra, sino por qué esta definición en sí tiene sentido. El punto es que si estamos definiendo en una variedad suave, puedo entender el problema, tenemos que lidiar con diferentes gráficos de coordenadas. Esto incluso se explica en el libro de Spivak. Pero los físicos parecen usar esta definición muy temprano, solo con el espacio vectorial R 3 . Y piden exactamente una propiedad de transformación relacionada con las rotaciones, solo un tipo particular de cambio de base.
Pero del álgebra lineal sabemos que dados tres números y un conjunto de vectores base, ya tenemos un vector. Nunca se hace ningún requisito sobre los tres números. Además, hay muchos otros cambios de base que podemos realizar. Así que no puedo entender esta definición realmente.
Ah, sí, "tres números y un conjunto de vectores base" . El físico oculta el hecho de que los tres números son los coeficientes de los vectores base detrás de esa ley de transformación, pero puedes demostrar fácilmente que tres números que obedecen esa ley de transformación bajo rotaciones son equivalentes a tres coeficientes de vectores base. Es equivalente, solo una elección diferente de definición.
Cuando los físicos hablan de vectores, no solo hablan de rotaciones. También intervienen otras transformaciones. Considere un vector A . Bajo la transformación de paridad, sus componentes se niegan. A menos que A es en realidad un producto vectorial de otros dos vectores B X C cuando bajo paridad sus componentes no cambian. En ese caso lo llamamos un pseudo-vector.
Tal vez valga la pena señalar que cuando los físicos hablan de un vector, lo que en realidad quieren decir es un vector contravariante. Mientras que para los matemáticos un vector es solo un elemento de un espacio vectorial.
@ACuriousMind: Las "preguntas de intuición" son para humanos curiosos que desean comprender y seguir el proceso de cómo se construyen las teorías científicas y por qué y cómo fallan. Son, al igual que la historia, la práctica y la opinión, de vital importancia para ellos. Las "preguntas objetivas" son solo para aquellos dioses que saben que han adquirido la verdad absoluta y consideran que sus opiniones están por encima de toda duda. Y el intercambio de pilas es para humanos, no para dioses ;.)
Solo un comentario: un científico informático daría otra definición más de un vector, como un tipo particular de estructura de datos.

Respuestas (5)

Esta es una desconexión muy común entre matemáticos y físicos (o al menos entre los físicos a quienes se les enseñaron cosas extrañas).

Lo que no se menciona en la definición "física" de vector, y de hecho lo que creo que la mayoría de las personas que usan esa definición no aprecian, es que cuando se le entrega una tupla de números, se le da implícitamente una regla para generar los componentes en cualquier base . .


Un ejemplo de física: considere el vector v = ( porque θ , pecado θ ) expresado en coordenadas cartesianas ( X , y ) . Sabemos que esto es un vector porque si rotamos nuestros ejes (digamos a ( X , y ) 45 en sentido antihorario de ( X , y ) ) pero siguió midiendo θ como el ángulo a cualquiera que sea nuestro primer eje ( X o X ), obtendríamos lo mismo. Eso es, porque θ   X ^ + pecado θ   y ^ = porque θ   X ^ + pecado θ   y ^ , y no nos vamos a molestar en escribir el principal en θ , ya que todo el mundo sabe θ es el ángulo al primero de cualquiera que sean nuestros dos ejes. En forma matricial,

( porque 45 pecado 45 pecado 45 porque 45 ) ( porque θ pecado θ ) = ( porque ( θ 45 ) pecado ( θ 45 ) ) = ( porque θ pecado θ ) parece ( porque θ pecado θ ) .

Por otro lado, ( porque θ , 2 ) no es un vector, porque en el sistema de coordenadas primadas sería

( porque 45 pecado 45 pecado 45 porque 45 ) ( porque θ 2 ) = 1 2 ( 2 + porque θ 2 porque θ ) ( porque θ 2 ) .


Un ejemplo matemático: considere la tupla ( porque θ , 2 ) . Dejar v Sea el vector con estos coeficientes en coordenadas cartesianas. Si rotamos nuestras coordenadas por 45 , seguiremos teniendo el mismo vector pero sus componentes cambiarán:

v original ( porque θ , 2 ) , v nuevo 1 2 ( 2 + porque θ , 2 porque θ ) .


No es que para los físicos los componentes sean de alguna manera medibles o físicamente significativos. Es que los físicos a menudo comprimen toda una familia de fórmulas en una sola expresión, transmitiendo (a menudo de una manera poco clara) más información de la que parecería indicar la notación. Sin embargo, con tanta información, surge la posibilidad de que las fórmulas para los coeficientes sean inconsistentes con ser cualquier vector en un espacio vectorial. En ese caso, uno no tiene la fórmula para un vector, o más bien tiene muchas fórmulas para muchos vectores diferentes.

Un matemático dirá que un vector es un elemento de un espacio vectorial y un espacio vectorial es solo un conjunto con una suma binaria y algunos escalares y una operación de escalar un vector por un escalar. Tu charla sobre tres números no lo convertiría en un vector para un matemático hasta que digas cómo sumas los vectores y los escalas por un escalar.

Así que las operaciones son importantes para todos.

Pero hay más operaciones. Veamos los vectores de columna y los vectores de fila. Con la adición y el escalado de matrices habituales, ambos son espacios vectoriales. Pero también tienen una relación natural entre sí (dada por la multiplicación de matrices).

Y ahora encontramos que a pesar de que cada uno puede ser una tupla n, los dos se transforman de manera diferente bajo una rotación si la idea es que cada uno es una función lineal tomando al otro como argumento.

Puedes pensar en el vector fila r como algo que toma vectores de columna C 1 y C 2 y envía su combinación lineal α C 1 + β C 2 a r ( α C 1 + β C 2 ) = α r C 1 + β r C 2 .

O puedes pensar en un vector de columna C como algo que toma vectores de fila r 1 y r 2 y envía su combinación lineal α r 1 + β r 2 a ( α r 1 + β r 2 ) C = α r 1 C + β r 2 C .

Y ahora, si se quiere respetar esa operación natural de ser funciones entre sí, entonces los vectores columna y fila deben transformarse de manera diferente aunque ambos sean n tuplas.

Y una base para uno determina una base para el otro si desea utilizar el producto matriz.

Si el vector tiene componentes en dos bases que vienen dadas por un vector de dos columnas y la transformación viene dada por una matriz Λ actuando a la izquierda, entonces los vectores de fila deben multiplicarse por Λ 1 A la derecha.

Las operaciones son siempre esenciales ya que el objetivo de un objeto es hacer cosas con él.

De hecho, desde el punto de vista de un matemático, un vector es un elemento de un espacio vectorial. Pero parece que la definición del físico requiere más que eso.

Para un matemático, un vector fila y un vector columna son ambos vectores (en diferentes espacios vectoriales). Para un físico, sabemos que son objetos lineales en sus propios espacios lineales, ¡pero puede elegir una base para uno y obtener una base para el otro también !

Y además de escalar y sumar, hay una tercera operación donde dados dos vectores de estos dos espacios diferentes (que tienen su base relacionada entre sí) hay un número. En particular para un marco { v 1 , v 2 , v 3 } de vectores columna independientes, digamos, en un espacio hay un marco recíproco o dual { w 1 , w 2 , w 3 } de vectores, digamos, filas de vectores del otro espacio tal que w i v j = d i j (donde el delta de Kronecker es cero a menos que i = j en cuyo caso es uno).

Entonces, una base para uno da naturalmente una definición de una base para el otro. Es esta relación entre dos espacios vectoriales diferentes lo que es importante. Ellos son diferentes. Agregar dos vectores de fila distintos de cero da un nuevo vector de fila. Agregar dos vectores de columna distintos de cero da un nuevo vector de columna. Pero si intentó agregar un vector de fila y un vector de columna, eso no es parte de la definición de ninguno de los dos espacios vectoriales por sí solo. En todo caso, simplemente los mantendría separados como sumar un número imaginario a un número real. Y es la multiplicación lo esencial. Y tampoco el espacio vectorial por sí solo habla de esa multiplicación.

Un físico quiere decirte explícitamente que ambos espacios vectoriales son útiles y necesarios y que se transforman de manera diferente aunque comparten una base (en cierto sentido). Y saber cómo se transforma cada uno te permite saber cuál es cuál.

Entonces, la clave es saber que cuando tienes una base y una cobase que son recíprocas entre sí, entonces se transforman de manera recíproca. Esa es la clave. Así que dije que las operaciones son importantes para todos. Pero los físicos están considerando dos espacios y una operación completamente nueva además de la suma y el escalado.

Cuando cambias una base, la otra base cambia y las coordenadas de ambas cambian, pero de diferentes maneras.

Sus vectores de fila son lo que un matemático llamaría formas únicas: funciones lineales de vectores.
@tfb El OP dijo específicamente que esto no estaba en un colector. Entonces, son solo dos espacios vectoriales con sus propias sumas separadas y sus propias multiplicaciones escalares separadas. Y pueden actuar unos sobre otros. Pero no hay razón para llamar a uno de los dos una forma y al otro un vector "real". Lo único que sabemos es que se transforman de manera diferente. Si uno se transforma por Λ por un lado el otro se transforma por Λ 1 Por otro lado.
Las formas únicas no tienen nada que ver con las variedades: una forma única es exactamente una función lineal de vectores en cualquier espacio vectorial. Por supuesto, son elementos del espacio vectorial dual, y los vectores originales son formas únicas en ese espacio dual. El punto es que puedes alejarte del enfoque de los viejos físicos de obsesionarse con las reglas de transformación.
@tfb ¿Quiere "deshacerse" del hecho de que cuando tiene una operación entre dos espacios, sus representaciones tienen que cambiar de manera relacionada? ¿Y reemplazarlo con algún tipo de misticismo en el que asigna diferentes nombres a los vectores de columna y fila? ¿Sabe que algunas partes del mundo escriben vectores regulares como vectores de fila y escriben covectores como vectores de columna y otras partes del mundo escriben vectores regulares como vectores de columna y escriben covectores como vectores de fila? Y el espacio original es solo isomorfo con el doble dual en un espacio original de dimensión finita.
@tfb Es simplemente un hecho que los dos tienen que transformarse de manera diferente incluso bajo una transformación activa si desea conservar su producto.
@Timeo, gracias por tu respuesta. He editado la pregunta sobre el problema de operaciones del que hablaste. De hecho, desde el punto de vista de un matemático, un vector es un elemento de un espacio vectorial. Pero parece que la definición del físico requiere más que eso. ¿Podrías echarle un vistazo a la edición? ¡Gracias de nuevo!
@Timaeus: todo lo que quiero hacer es sugerir que podría ser más interesante enfocarse en las propiedades de los espacios vectoriales como espacios vectoriales en lugar de simplemente enfocarse intensamente en una propiedad particular y una representación particular. Esto es lo que hacen los matemáticos y, tal vez, los físicos puedan aprender de lo que hacen (me doy cuenta de que esto es una herejía). Y, por supuesto, las diversas cosas que no se mantienen cuando la dimensión no es finita son solo una de las propiedades interesantes.
@tfb No es una cuestión de representación. Los físicos consideran que un espacio lineal es simplemente un subconjunto de un espacio multilineal. Si los matemáticos cubrieran espacios multilineales y álgebras multivectoriales cuando cubrieran vectores, entonces no habría necesidad de tener dos culturas sobre el tema. Un espacio vectorial es solo un subconjunto de un espacio multilineal.
@Timaeus: Lo siento, nada de lo que dije tuvo nada que ver con los espacios multilineales y tampoco la pregunta, que yo sepa. Esta discusión no va a ninguna parte, ¿verdad? Así que me detendré ahora.
@tfb Te he estado diciendo todo el tiempo que la razón por la que los físicos usan la definición que usan es porque necesitan álgebra multilineal para hacer física. Cuando enseñas álgebra multilineal, ves muchos subconjuntos que son espacios lineales. Algunos de ellos son incluso isomorfos como espacios lineales. Pero aún desea poder distinguir un par de vectores covectoriales y no confundirse acerca de cuál tiene en un momento particular. Es la respuesta a la pregunta.
Supongo que todo lo que me gustaría es que no afirmes que 'los físicos usan la definición que usan': soy físico y no lo hago. Pero yo soy una persona de GR, y no creo que ninguna de las personas de GR lo haga, así que tal vez solo seamos raros.
@tfb también soy una persona de GR, y en realidad no te creo. Pero es posible que estemos hablando entre nosotros y pensemos que el otro está diciendo algo diferente de lo que realmente estamos diciendo. El OP preguntó por qué la gente hace lo que hace. Y la única razón real es realizar un seguimiento de una base compartida para un marco de vectores y un marco de covectores. No necesita usar una base nunca, por lo que no es necesario (puede tener variedades tangentes o paquetes cotangentes o cualquier cosa que desee sin una base). Pero Griffiths tiene razón: si eliges norte Escalares de Lorentz, un orden norte -tuple de ellos no es un vector.
Creo que estamos hablando de propósitos cruzados: comentar fora conducen a eso. Para GR, encuentro que el enfoque de construir el espacio tangente a partir de derivadas direccionales, construir su espacio dual, ver que los vectores en el espacio dual (una forma) son gradientes de funciones y luego simplemente construir toda la maquinaria a partir de ahí para que sea más geométricamente útil. que el enfoque de contabilidad de vectores-son-tuplas-con-una-ley-de-transformación. Por supuesto, los componentes de las cosas en estos espacios se transforman bajo un cambio de base, pero los vectores y todos los demás objetos son para mí más que solo sus componentes.
(Continuación) Lo de los n-escalares-no-son-un-vector también es interesante. Elija tres campos escalares, R , GRAMO , B definido en alguna variedad. Bueno, claramente ( R , GRAMO , B ) en algún punto no es un elemento del espacio tangente en ese punto. Pero es un elemento de algún espacio: de hecho, especifica el color de cada punto de la variedad, y hay una estructura de haz de fibras obvia, siendo las fibras espacio de color. Creo que ese es mi problema con todo el asunto: el enfoque de tupla con una regla combina los vectores y el espacio en el que viven, llamando solo vectores en un espacio (o fibra) vectores.
@tfb Si lee atentamente la respuesta, notará que solo digo que una base para un espacio vectorial también es efectivamente una base para su espacio dual y debe mantener los dos en orden. Se trata de cómo los componentes en ambos tendrían que cambiar cuando cambias una base. El objetivo real es prepararlo para diferentes espacios, y dado que los estudiantes ya están acostumbrados a los vectores de fila y los vectores de columna del álgebra matricial, deben saber esto. No es la lección completa de todo lo que necesita saber sobre el álgebra multilineal, es solo la primera lección. Y en física haces álgebra multilineal

Permítanme tratar de aclarar (permanezcamos en un espacio tridimensional plano):

En física, cualquier triple de números que se transforma como el radio vector bajo rotaciones se llama vector. (Esta definición se da, por ejemplo, en las conferencias de Feynmans) ¿Por qué es útil esta definición? Queremos que un vector represente una cantidad 'real'/física. Simplemente imagine una flecha colocada en su habitación (esto es una especie de cantidad real), ahora elija cualquier sistema de coordenadas rectangulares y anote los componentes. Ahora tome un sistema de coordenadas diferente y haga lo mismo. (por supuesto que están relacionados por la ley de transformación correcta). Si no siguieran la ley de transformación, la 'flecha' dependería de tus coordenadas. La física no puede depender de tu elección de coordenadas (si lo hace, estás un poco en problemas).

Tal vez este ejemplo ayude: elija un sistema de coordenadas (como si realmente colocara algunas reglas). Mida la temperatura en (0,0,1), en (0,1,0) y en (1,0,0). Supongamos que son diferentes. (0,0,1) está dentro de su apartamento, (0,1,0) está afuera y (1,0,0) está en su placa calefactora. Escribe este triple. ¿Es un vector o 3 números escalares? (este último por supuesto). Si gira el sistema de coordenadas, no se transforma como un vector.

Por supuesto, formalmente puede decir que siempre toma la base estándar de R^n (el enfoque matemático) y luego cualquier secuencia de números define un vector. Pero esto no representa vectores 'reales'.

Tienes razón al decir que la explicación de Griffiths no resuelve el problema. Decir norte pag son peras y norte b son plátanos, podemos cambiar los componentes en norte T = norte pag + norte b el número total de frutas y norte D = norte pag norte b la diferencia. Esta es una transformación lineal tanto como lo es una rotación en el espacio. Hay muchas ramas de la física y la ingeniería que hacen esto (básicamente, cualquier proceso de minimización en algún espacio de parámetros). Entonces, ¿qué es diferente?

La diferencia es que los tipos de vectores que está considerando (desplazamiento infinitesimal, velocidad, fuerza, ...) están definidos en un punto: tienen un punto de aplicación . Es decir, no es solo que tienes una velocidad, tienes una velocidad aquí en el centro de masa de la pelota. No solo tienes una fuerza, la fuerza se aplica aquí en el centro de este auto. Sumar dos fuerzas aplicadas en dos puntos diferentes no tiene sentido. Además, la unidad del componente depende de la unidad del espacio. Si X se mide en metros, entonces v X se mide en metros por segundo. Entonces, hay un vínculo en cómo el cambio de coordenadas en el espacio afecta los componentes de su vector .

Ahora, matemáticamente dirías que realmente tienes una variedad, y el vector está en su espacio tangente. Sin embargo, esto no funciona en absoluto físicamente. Como no podemos sumar velocidades con fuerzas, deben vivir en diferentes espacios tangentes. Entonces, básicamente dices que un vector es un conjunto de números que cambian de una manera particular (es decir, son isomorfos a los vectores en el espacio tangente en el punto).

¡Espero que esto ayude!

La mayoría de las veces en Física, desea que su "vector" sea una cantidad física, no solo una yuxtaposición arbitraria de números (peras, manzanas ... como en su ejemplo). Por lo tanto, debe transformarse como la cantidad física que debe representar. En general, en Física nos interesan los campos (escalares, vectoriales, tensoriales, espinoriales) que se transforman de manera definida bajo la acción de un determinado grupo de transformaciones: nuestros vectores son los "vectores" habituales del "álgebra lineal" más el requisito de que sean "tensores" para un determinado grupo de interés.

En resumen: los vectores en Física son vectores de matemáticos (es decir, son elementos de un espacio vectorial)... pero no todos los vectores de matemáticos son "vectores físicos" (es decir, los vectores de matemáticos pueden ser "listas").

Si inventa su propio conjunto de reglas para dar sentido a la adición de peras, manzanas y elefantes, entonces puede actualizar su "vector de álgebra lineal" para que sea un "vector de física" bajo su conjunto de reglas diseñado.

Nota #1: un "vector de álgebra lineal" como (temperatura, densidad, módulo de la velocidad, intensidad del campo magnético...) está hecho de muchas cantidades físicas (escalares) pero no se comporta como un vector de "física" genuino.

Nota n.º 2: respuestas útiles a las mismas preguntas (en una pregunta relacionada): https://physics.stackexchange.com/a/627426/226902 , https://physics.stackexchange.com/a/627456/226902 , https ://física.stackexchange.com/a/406415/226902