Confusiones sobre los vectores covariante y contravariante

Estoy tratando de conectar los conceptos que aprendí de la relatividad especial con los de la relatividad general. Echa un vistazo a este ejemplo de wikipedia. Encuentran una matriz de transformación de los componentes contravariantes de un vector a los componentes covariantes.

Ahora pasemos a la relatividad general. Sé que en el espacio plano, el tensor métrico es solo la métrica de Minkowski η m v , y sé que para cambiar un vector a un covector, simplemente contraes la métrica con el vector.

Pero si tuviera que tomar un vector V m y bajar el índice a un covector V m en un espacio plano, ciertamente no sería la complicada matriz de cambio de base que se muestra en el ejemplo. ¿Me estoy perdiendo de algo? Cuando bajas un índice, ¿estás encontrando una entidad completamente diferente? ¿O está encontrando los componentes covariantes del mismo vector?

Espero que esto tenga sentido.

Tienes dos respuestas diferentes porque realmente hay dos formas de establecer el formalismo. Alfred's es el moderno. Creo que el método de Steil todavía se usa en las clases de ingeniería, pero es más complicado cuando tienes métricas complicadas, como en GR.
@knzhou Toda mi experiencia sobre el tema proviene de GR. ¿Qué entiendes por "más torpe"? Me refiero a Alfred Centauri, dio 1 fórmula correcta, le di otra y media. La pregunta puede seguir siendo cómo ponerlos en el contexto correcto, sí, pero creo que matemáticamente debería haber una teoría/formalismo sólido detrás de esto. (¿O no?)
@MJSteil Toda mi experiencia también proviene de GR. Los libros actuales más populares (Carroll, Wald, MTW) distinguen vectores y covectores como objetos diferentes. Solo he visto los dos equiparados por ingenieros.
Digo "torpe" porque decir que un vector tiene "componentes covariantes/contravariantes" elimina por completo las interpretaciones geométricas de vectores y covectores, que se muestran en la respuesta de Alfred; hace que sea más difícil ver por qué un covector es una función lineal de vectores a R , por ejemplo.
@knzhou Miré las primeras secciones de Wald y ahora entiendo el punto que usted y Alfred Centauri hicieron. Hay una diferencia que uno debe tener en cuenta. Nunca investigué los detalles en esas primeras secciones de esos libros modernos y me enseñaron GR con notas de clase, donde no aparecen las palabras "dual" o "cotangente".

Respuestas (3)

Está tratando con diferentes objetos geométricos: vectores tangentes, que se pueden realizar como clases de equivalencia de curvas, y vectores cotangentes, que se pueden realizar como clases de equivalencia de funciones de valor real (piense en diferenciales).

Hay una operación de emparejamiento lineal natural entre estos objetos: componga una curva y una función, y obtendrá un mapa R R . Tómese su derivada en el punto en cuestión, et voilà. Esta operación de emparejamiento nos permite considerar los espacios como 'dual' y, en particular, identificar el espacio cotangente con el espacio de funcionales lineales en el espacio tangente.

Dado un sistema de coordenadas en una variedad, las líneas de coordenadas son curvas, lo que produce una base del espacio tangente, mientras que los componentes del gráfico de coordenadas son funciones, lo que produce una base del espacio cotangente. Es fácil demostrar que estas bases son algebraicamente duales, es decir, su emparejamiento produce la delta de Kronecker.

En las variedades (pseudo-)riemannianas, también hay un tensor métrico gramo , una forma bilineal no degenerada. Este tensor induce un isomorfismo gramo : v gramo ( v , ) de la tangente al espacio cotangente ("bajando el índice"), con un mapa inverso gramo ('aumentando el índice').

El mapa gramo se puede usar para retrotraer nuestra base del espacio cotangente al espacio tangente, produciendo la base recíproca. Los componentes de un vector v relativas a la base recíproca del espacio tangente son las mismas que las componentes del covector gramo v relativa a la base dual del espacio cotangente. Esto hace posible fusionar vectores y covectores, pero hoy en día se considera una mala idea.

Habiendo dicho todo eso, ahora vamos a tu pregunta real:

Pero si tuviera que tomar un vector V m y bajar el índice a un covector V m en un espacio plano, ciertamente no sería la complicada matriz de cambio de base que se muestra en el ejemplo. ¿Me estoy perdiendo de algo?

La métrica de Minkowski es esa 'matriz de cambio de base complicada': es solo que está tratando con una base ortonormal, lo que lo hace simple.

tonto de mí, originalmente, tenía y conmutado; debería estar bien ahora...
¡Oh! ¡Creo que lo entiendo! Entonces, debería obtener la matriz de identidad (ya que es un espacio 2D) en esa matriz de cambio de base que se muestra en el ejemplo si convierto de la base de coordenadas a una base ortonormal. ¿Cómo haría para hacer esto? (Esto me ayudaría GRANDEMENTE a entender). Recuerdo haber leído sobre esto en mi libro GR de Sean Carroll, pero todavía soy muy ignorante en todo el asunto.
@ user41178: si solo está buscando una base ortonormal, existe el proceso Gram-Schmidt ; si está buscando una base de coordenadas ortonormales, debe encontrar las coordenadas normales de Riemann

Cuando bajas un índice, ¿estás encontrando una entidad completamente diferente?

Sí, es una entidad diferente. V m son los componentes del vector V mientras V m son los componentes de la forma única V ~ doble a V con la relación fundamental

V ~ , V = V m V m = gramo m v V v V m = V 2

En resumen V y V ~ no son la misma entidad ya que pertenecen a diferentes espacios vectoriales pero están relacionados a través de la métrica.

Actualización : para enfatizar que los vectores y las formas únicas son objetos geométricos diferentes , considere la siguiente imagen y leyenda del artículo de Wikipedia " Forma única " .

ingrese la descripción de la imagen aquí

Funcionales lineales (formas 1) α , β y su suma σ y vectores tu , v , w , en el espacio euclidiano 3d. El número de hiperplanos (forma 1) intersecados por un vector es igual al producto interno.

Entonces, ¿qué es todo ese negocio en SR sobre un vector que tiene componentes contravariantes y covariantes? ¿Es solo una cuestión de la misma nomenclatura? Los dos componentes diferentes provienen del hecho de que en un sistema de coordenadas sesgadas, hay dos formas posibles de representar un vector. Dejando caer una perpendicular a los ejes, o dejando caer una paralela a los ejes, ambos convergen para ser iguales en un espacio no sesgado. No entiendo por qué las cosas son tan diferentes en GR.

No lo vería de la forma en que @Alfred Centauri lo ha descrito. Lo que podría ser que no entienda bien la respuesta/ no entienda el significado matemático de las diferentes entidades aquí, pero volveré a ello después de mi opinión sobre el tema.

Hay un vector físico V y uno puede expresar este vector con respecto a la base co- o contravariante:

V = V m mi µ = V m mi µ .

{ mi µ } y { mi µ } son solo bases diferentes, que están relacionadas por mi µ mi v = d m     v . La base recíproca no es independiente de { mi µ } , tampoco lo son los componentes resultantes: ya que están relacionados por V m = gramo m v V v . Permítanme citar la página de wikipedia que OP vinculó en ese punto:

en un espacio vectorial V sobre un campo k con una forma bilineal gramo : V × V k (que puede denominarse tensor métrico), hay poca distinción entre vectores covariantes y contravariantes, porque la forma bilineal permite que los covectores se identifiquen con vectores. es decir, un vector v determina unívocamente un covector α a través de

α ( w ) = gramo ( v , w )
para todos los vectores w. Por el contrario, cada covector α determina un vector único v por esta ecuación. Debido a esta identificación de vectores con covectores, se puede hablar de componentes covariantes o componentes contravariantes de un vector, es decir, son solo representaciones del mismo vector usando bases recíprocas.

Estoy de acuerdo con @Alfred Centauri en que los vectores y componentes covariantes y contravariantes no son lo mismo, pero no estoy seguro de llamarlos entidades diferentes. Este podría ser mi error porque realmente no sé qué hacer con las "entidades" en un contexto matemático, pero para mí parece una gran diferencia entre dos objetos tan estrechamente relacionados.

EDITAR: después de algunos puntos hechos por @knzhou en los comentarios y después de algunas lecturas adicionales en un libro de texto moderno (Wald) sobre GR (que difiere un poco de las notas de lectura de GR de la "vieja escuela" de las que me enseñaron GR).

Creo que el punto de vista moderno es (como señaló @Alfred Centauri) distinguir realmente entre vectores (contravariante) y vectores duales (cotangente, covariante). La ecuación y los puntos que hice arriba no distinguen entre vectores y vectores duales y elegí una (base/métrica arbitraria) para expresar mi punto. La cita que hice en realidad describe la relación "íntima" entre ambos objetos, pero a un nivel fundamental e independiente de base/métrica son matemática y geométricamente diferentes. Hay una relación entre ellos pero son objetos diferentes/entidades diferentes.

Pero si uno introduce una base/métrica, puede usarla para

... establecer una correspondencia biunívoca entre vectores y vectores duales. De hecho, dada una métrica gramo podríamos usar esta correspondencia para eludir por completo la necesidad de introducir vectores duales. Normalmente esto se hace y explica por qué el concepto de vectores duales no es más familiar para la mayoría de los físicos. Sin embargo, en relatividad general estaremos resolviendo para la métrica del espacio-tiempo; dado que la métrica no se conoce desde el principio, es esencial que mantengamos completamente clara la distinción entre vectores y vectores duales. [RM Wald, 1984, General Relativity, p. 23]

Hay espacios vectoriales sin métrica, y ahí la diferencia entre una forma y un vector es fundamental.
Estoy totalmente en desacuerdo con esta respuesta. V m mi m y V m mi m son objetos completamente diferentes, es decir, un vector y un funcional lineal, respectivamente, y establecerlos como iguales solo está sembrando las semillas de una mayor confusión en las personas que desconocen la diferencia. El espacio vectorial W y su doble W son isomorfos solo porque tienen la misma dimensión, y es probable que que no haya isomorfismo natural (en términos generales, independiente de la base) entre ellos. Solo en presencia de una métrica hay un isomorfismo canónico. Un -1 bien ganado de mi parte.
@EmilioPisanty: depende de si mi m denota la base dual o recíproca; debería poder desarrollar la teoría muy bien en términos de esto último, pero estoy de acuerdo en que no es algo que recomendaría
@Christoph Sí, puede cambiar la notación, pero la diferencia permanece: es una transformación trivial y no cambia la estructura.
@EmilioPisanty: por supuesto, la diferencia entre los vectores tangente y cotangente permanece; pero dada una métrica, puede expresar todo en términos de la base recíproca y nunca necesita hablar de covectores; todas las fórmulas escritas en notación tensorial clásica deben seguir siendo válidas ya que los componentes del vector en relación con la base recíproca son idénticos a los componentes del covector correspondiente en relación con la base dual; dado mi m = / X m , solo define mi m = gramo m v / X v en lugar de mi m = d X m ; entonces, de hecho tenemos V m mi m V m mi m
@Christoph Ese es precisamente el punto. "Dada una métrica" ​​oscurece toda la estructura algebraica lineal y geométrica que está ahí antes de la métrica, y aclara el hecho de que un cambio en la métrica también cambiará la identificación canónica entre el espacio vectorial y su dual. Este es precisamente el tipo de confusión que crea confusiones como las de OP, por lo que es tan importante mantener las cosas separadas.
@EmilioPisanty: estamos en un acuerdo violento aquí, excepto que enfatizaría que enmarcar las cosas en términos de bases recíprocas es más bien un error que un error absoluto.