¿La derivada parcial es un vector o un vector dual?

El libro de texto (Introducción a la teoría clásica de partículas y campos, de Boris Kosyakov) define una hipersuperficie por

F ( X )   =   C ,
dónde F C [ METRO 4 , R ] . Diferenciando da
d F   =   ( m F ) d X m   =   0.
Luego el texto dice d X m es un covector y m F un vector Aprendí de otro libro que d X m son 4 vectores duales (en el espacio de Minkowski), m indexa el vector dual en sí mismo, no los componentes de un solo vector dual. Por eso pienso m F también deben ser 4 vectores, cada uno de los cuales es la derivada direccional a lo largo de un eje de coordenadas. Pero este libro más adelante afirma que ( m F ) d X m = 0 describe un hiperplano Σ con normalidad m F atravesado por vectores d X m y llamadas Σ un plano tangente (página 33-34). Esta vez, parece tratar m F como un solo vector y d X m como vectores. Pero yo pienso d X m debe abarcar un espacio cotangente.

Necesito ayuda para aclarar estas cosas.

[editado por Ben Crowell] El siguiente parece ser el texto al que se refiere la pregunta, del Apéndice A (que Amazon me dejó ver a través de su mirilla):

Elie Cartan propuso usar coordenadas diferenciales d X i como una base conveniente de 1-formas. los diferenciales d X i transforman como covectores [...] Además, cuando se usa en la derivada direccional d X i F / X i , d X i puede verse como un funcional lineal que toma valores reales en los vectores F / X i . Los elementos de línea d X i se llaman [...] 1-formas.

Después de escribir una respuesta y luego lograr ver lo que escribió Kosyakov, estoy tan confundido como elflyao. Me interesaría escuchar a otros que puedan tener una experiencia más amplia o que puedan explicar si Kosyakov tiene un punto de vista inusual.
m F es una función no un vector. Quizás te refieres al cuádruple de los m F '¿s?
@MBN: " m F es una función, no un vector". ¿Quiere decir que es una función en el sentido de que varía en el espacio-tiempo? Claro, eso es ciertamente cierto, pero es una función con valores vectoriales. m F 's?" Lo que normalmente quiero decir con esto es que cuando el índice m no está vinculado y no se ha especificado ningún sistema de coordenadas, la notación de índice m F indica todo el covector de gradiente, como en la notación de índice abstracto. Esto es similar a "la función F ( X ) ," dónde X está desatado. Los "vectores" de Kosyakov F / X i ," con [...]
plural "vectores", sugiere que él piensa en algo como F / X 0 como vector Esto no tiene mucho sentido para mí, ya que claramente no puede tener las propiedades de transformación de un vector. Es un solo número real y, por ejemplo, bajo un cambio de coordenadas X 0 7 X 0 , F / X 0 ( 1 / 7 ) F / X 0 , que es lo que haría un componente de un covector. Un componente de un vector sería 7 veces más grande .
@BenCrowell: OK, entonces tiene sentido. A mí me pareció una derivada parcial.
¿Esta pregunta no estaba ya respondida? Veo muchas respuestas geniales a continuación...
Comparé las definiciones de Kosyakov con Wald, General Relativity, pp. 15 y 20ff. Hay algunas inconsistencias. Wald define F como el conjunto de campos escalares uniformes en una variedad METRO , y define un vector tangente v V pags como un mapa v : F R que es lineal y obedece la regla de Leibniz en pags , por lo que puede interpretarse como una derivada direccional en pags . Esto hace que una derivada parcial sea un vector como cuestión de definición, y también significa que para F F , F / X i es un número real, no un vector como lo describe Kosyakov.
para respuestas breves y sencillas, visite physicsoverflow.org/24735

Respuestas (5)

A continuación, se incluyen algunos extractos del libro Introducción a la teoría clásica de partículas y campos (2007) de B. Kosyakov.

Las declaraciones controvertidas/engañosas/erróneas están marcadas en r mi d . Estamos de acuerdo con OP en que las declaraciones marcadas en r mi d son terminología/convenciones estándar opuestas. Algunas (no todas) las declaraciones correctas están marcadas en gramo r mi mi norte .

1.2 Estructuras afines y métricas

[...] Dejar mi 1 , , mi norte y mi 1 , , mi norte ser dos bases arbitrarias. Cada v mi C t o r de esta última base puede ampliarse en términos de v mi C t o r s de la base anterior:

(1.37) mi i   =   mi j   L j i .

[...] Así, los funcionales lineales forman el espacio vectorial dual V . Si V es norte -dimensional, también lo es V . De hecho, deja mi 1 , , mi norte ser una base en V . Entonces cualquier ω V se especifica por norte numeros reales ω 1 = ω ( mi 1 ) , , ω norte = ω ( mi norte ) , y el valor de ω en a = a i mi i es dado por

(1.52) ω ( a )   =   ω i a i .
Vemos eso V es isomorfo a V . Es por eso que a veces nos referimos a los funcionales lineales como C o v mi C t o r s . Una mirada más cercana a (1.52) muestra que un v mi C t o r a puede considerarse como un funcional lineal en V . Se puede demostrar (Problema 1.2.3) que cambiar la base (1.37) implica la transformación de ω i según la misma ley:
(1.53) ω i   =   ω j   L j i .
Por lo general, suprimiremos el argumento de ω ( a ) e identificar ω con sus componentes ω i . [...]

1.3 Vectores, tensores y norte -Formularios

[...] Una generalización simple de vectores y covectores son tensores. Algebraicamente, un tensor T de rango ( metro , norte ) es un mapeo multilineal

(1.112) T : V × × V metro  veces × V × × V norte  veces R .
Ya hemos encontrado ejemplos de tensores en la sección anterior: un escalar es un rango ( 0 , 0 ) tensor, un v mi C t o r es un rango ( 1 , 0 ) tensor, un C o v mi C t o r es un rango ( 0 , 1 ) tensor, la métrica gramo i j es un rango ( 0 , 2 ) , tiempo gramo i j es un rango ( 2 , 0 ) tensor y delta de Kronecker d i j es un rango ( 1 , 1 ) tensor. Tal como F o tu r   v mi C t o r s pueden ser considerados como objetos que se transforman de acuerdo con la ley
(1.113) a m   =   Λ m v   a v ,
dónde Λ m v es la matriz de transformación de Lorentz que relaciona los dos marcos de referencia, por lo que los tensores de rango ( metro , norte ) se puede describir en términos de representaciones de grupos de Lorentz por el requisito de que su ley de transformación sea
(1.114) T m 1 m metro v 1 v norte   =   Λ m 1 α 1 Λ m metro α metro   T α 1 α metro β 1 β norte   Λ β 1 v 1 Λ β norte v norte .

[...] El operador diferencial

(1.140) m   =   X m
se transforma como un C o v a r i a norte t   v mi C t o r . Para ver esto, usamos la regla de la cadena para la diferenciación:
(1.141) X m   =   X v X m X v ,
y tenga en cuenta que, para transformaciones de coordenadas lineales X m = Λ m v   X v + a m
(1.142) X m X v   =   Λ m v .
Siempre usaremos la notación abreviada m , y trate este operador diferencial como un operador ordinario v mi C t o r . [...]

1.4 Líneas y Superficies

[...] Definimos una hipersuperficie METRO norte 1 por

(1.176) F ( X )   =   C ,
dónde F es una función suave arbitraria METRO 4 R . Derivando (1.176) se obtiene
(1.177) ( m F ) d X m   =   0 .
Uno puede ver d X m como un C o v mi C t o r , y m F como un v mi C t o r . Por cierto, d X m se transforma como un C o v mi C t o r bajo transformaciones de coordenadas lineales X m = Λ m v   X v + a m ,
(1.178) d X m   =   X m X v d X v   =   Λ m v   d X v ,
y m F se transforma como un v mi C t o r :
(1.179) F X m   =   F X v X v X m   =   F X v Λ v m .
En el espacio de Minkowski, los vectores y covectores se pueden convertir entre sí de acuerdo con (1.121). Por esta razón, a menudo consideraremos d X m como vectores. [...]

A. Formas diferenciales

[...] Elie Cartan propuso usar coordenadas diferenciales d X i como una base conveniente de o norte mi   F o r metro s . los diferenciales d X i transformar como C o v mi C t o r s bajo un cambio de coordenadas local,

(A.1) d X j   =   X j X i d X i .
[Si el cambio de coordenadas está especializado en transformaciones euclidianas X j = L j i   X i + C j , después X j / X i reduce a L j i , una matriz ortogonal con entradas constantes, y (A.1) b mi C o metro mi s (1.53), la ley de transformación para C o v mi C t o r s .] [...]

Notas:

  1. La ecuación corregida. (1.114) dice

    (1.114) T m 1 m metro v 1 v norte   =   Λ m 1 α 1 Λ m metro α metro   T α 1 α metro β 1 β norte   ( Λ 1 ) β 1 v 1 ( Λ 1 ) β norte v norte .

  2. La ecuación corregida. (1.179) dice

    (1.179) F X m   =   F X v X v X m   =   F X v ( Λ 1 ) v m .

  3. Para explicar por qué (A.1) no se convierte en (1.53), sea mi 1 , , mi norte , ser una base (dual) en V . A la luz de (1.53), para un covector ω = ω i mi i V Para ser independiente de la elección de la base, la base dual debe transformarse como

    (*) mi i   =   METRO i j   mi j ,
    dónde
    (1.45) METRO   =   L 1 .
    Identificando las bases duales mi i d X i , la ecuación anterior (*) se convierte en (A.1). Además, en la oración debajo de la eq. (A.1), el L La matriz debe ser reemplazada por la METRO matriz en dos lugares.

  4. Finalmente, respondamos la pregunta del título de OP: una derivada parcial m F (de una función escalar F ) es un componente de un vector cotangente d F = ( m F ) d X m , mientras que la derivada parcial no aplicada m es un elemento base local de un vector tangente. Ambas cosas m F y m transformar como covectores.

Bueno, el punto 4. está muy bien expresado, pero no me gustan tanto las etiquetas rojas/verdes, ya que esto es una convención más que cualquier otra cosa (por supuesto, excepto las erratas de cualquier libro).
@NikosM.: Los puntos 1 y 2 de Qmechanic no son cuestiones de convención; Kosyakov ha cometido errores en esos lugares.

Eché un vistazo rápido a las páginas 59 y 60 de "Gravitación", sección 2.6 "Gradientes y derivadas direccionales", para ver si hay algo que podamos usar para aclarar este problema.

En esta sección, el gradiente de F es d F , la derivada direccional a lo largo del vector v es v F y se cumple la siguiente relación:

v F = d F , v

Entonces asumiendo un conjunto de formas base d X m y vectores de base dual mi m tenemos

m F mi m F = d F , mi m = F X m

Entonces, de acuerdo con MTW en esta sección, m F son los componentes de d F sobre esta base.

Por lo tanto, debe ser que, por la segunda ecuación en la pregunta,

d F = ( m F ) d X m

que es solo la expansión de la forma d F en las formas de base d X m

En cuanto a por qué Kosyakov identificaría esto como una contracción de una forma y un vector, no tengo ni idea.

Creo que esto es solo un uso impreciso del lenguaje por parte del autor: no sucede nada misterioso, simplemente no está bien expresado:

Como se indica en la pregunta, para una hipersuperficie Σ definido por

F ( X ) = C R

encontramos eso

d F = 0

debe aguantar Σ . Esto es crucial : significa que el formulario 1 d F actuando sobre vectores tangentes de Σ debe desaparecer de forma idéntica:

v T X Σ : d F ( v ) = ( m F ) v m = 0

Pero podemos reconocer ( m F ) v m como el producto escalar de los vectores v y gramo ( d F , ˙ ) , siendo este último el habitual dual de d F con componentes m F . Ya que T X Σ T X METRO 4 naturalmente, esto significa que d F = 0 de hecho barre una hipersuperficie en el espacio tangente que tiene, en dicción descuidada, el gradiente como su normal (aunque en realidad es su dual).

Creo que el punto crucial está en la oración "Pero podemos reconocer...", y es aquí donde no te sigo. Dado que el gradiente d F es una forma 1, es dual m F es un vector Si es así, entonces no podemos tomar el producto escalar del vector m F con un vector v m . No veo ninguna razón para llevar duales a ningún lado. Incluso si no tuviéramos una métrica y, por lo tanto, no pudiéramos tomar duales, simplemente podríamos tener ( m F ) v m , el producto escalar de un covector con un vector.
@BenCrowell: Sí, de hecho. Eso aún definirá una hipersuperficie en el espacio tangente, pero no tendremos un "vector normal" para describirlo. Estoy de acuerdo en que no hay necesidad de tomar duales, pero creo que Kosyakov implícitamente hace exactamente eso cuando habla de m F siendo un vector normal. Sin embargo, su nomenclatura me parece un poco poco ortodoxa: un producto escalar está entre dos vectores o dos covectores (y generalmente inducido por la métrica), aplicar un covector a un vector no es un producto escalar.
OK, por "producto escalar" simplemente me refiero a un producto que se transforma como un escalar. Entonces, tomar "producto escalar" en su respuesta significa gramo ( , ) , no entiendo por qué uno describiría ( m F ) v m como un producto escalar de v m con m . Eso podría indicar que tomamos el gradiente, elevamos su índice, bajamos su índice y luego nos contraemos. No veo el punto de subir un índice y luego volver a bajarlo inmediatamente. O podríamos subir el índice del gradiente, bajar v m índice y contrato. Una vez más, ¿por qué subir o bajar?
@BenCrowell: porque produce la interpretación geométrica de m F como el vector normal al hiperplano de vectores tangentes de Σ . No creo que haya nada más profundo que eso aquí.

Creo que estás confundido porque estás mezclando cantidades relacionadas pero ligeramente diferentes.

Sí, una derivada parcial es un vector y sí, un vector es un objeto con un índice superior.

La afirmación anterior puede parecer contradictoria, pero en realidad no lo es por la siguiente razón. Un vector es una cantidad abstracta que es un elemento de un "espacio vectorial". En este caso, el espacio vectorial que se está discutiendo es el espacio tangente. En un espacio vectorial, se puede elegir una base, cualquier base. Una vez que se ha elegido una base, se puede describir cualquier otro vector en el espacio vectorial simplemente prescribiendo un conjunto de números. por ejemplo en R 2 (más bien el espacio afín correspondiente), uno puede elegir una base de vectores como X ^ y y ^ . Una vez hecho esto, cualquier otro vector puede describirse simplemente con 2 números. Por ejemplo los números ( 1 , 2 ) realmente implica que estamos hablando del vector X ^ + 2 y ^ .

¿Cómo se aplica aquí la discusión anterior?

En el espacio tangente, una elección natural de base es el conjunto de derivadas parciales m = { 0 , 1 , 2 , 3 } (asumiendo que estamos en METRO 4 . Cada derivada parcial es en sí misma un vector.

Ahora, una vez que se ha elegido esta base, cualquier otro vector se puede describir mediante un conjunto de 4 números v m = ( v 0 , v 1 , v 2 , v 3 ) que corresponde al vector v m m . Es este sentido, que la afirmación en negrita anterior es verdadera. A menudo, dado que la base de las derivadas parciales es obvia, uno simplemente describe un vector como un objeto con un índice superior v m .

A continuación, analicemos los co-vectores (cantidades con un índice más bajo). Estos son elementos del espacio vectorial dual (que es el espacio de funciones lineales en el espacio vectorial) del espacio tangente. Dada la base de la derivada parcial en el espacio tangente, entonces se tiene una base natural en el espacio cotangente denotado por d X m = { d X 0 , d X 1 , d X 2 , d X 3 } . Tenga en cuenta que cada diferencial en sí mismo es un covector. Esta base natural está definida por la relación d X m ( v ) = d v m . Como antes, una vez elegida esta base natural, cualquier elemento del espacio cotangente puede describirse mediante 4 números, a saber v m = { v 0 , v 1 , v 2 , v 3 } que corresponde al covector v m d X m .

En resumen , m para cada m corresponde a un vector de 4 dimensiones mientras que v m para cada m corresponde a 4 componentes de un solo vector. Similarmente, d X m para cada m corresponde a un covector de 4 dimensiones mientras que v m para cada m corresponde a 4 componentes de un solo covector.

PD 1 - A veces a la gente le gusta usar bases distintas a m y d X m en los espacios tangente y cotangente respectivamente. Estas se conocen como bases no coordinadas.

PD 2 - Para que quede claro, m es un vector, pero m F es una funcion

Es interesante notar que Elie Cartan no escribió d X i como lo hacemos hoy. Todavía no había adoptado las distinciones cuidadosas, al estilo de Ricci, con índices. para él, X i no era un componente o coordenada de nada: era una función en la variedad, o al menos en un pequeño vecindario, por lo que era una forma de grado cero, no tenía componentes en absoluto, no era ni covariante ni contravariante, es simplemente lo mismo como X o X o Z . Ahora la "d" es un operador, que cuando se aplica a formas p, produce ( pags + 1 ) formas, por lo que, cuando se aplica a X 1 , produce una forma 1, que es un vector cotangente en cada punto de la variedad. Entonces un covector, entonces covariante. Asi que d X i tiene componentes covariantes. Pero es un covector. Sus componentes son X i X 1 etc. Ahora de la misma manera, X i es un vector (campo, es decir, un vector que depende del punto en la variedad). No es el componente de nada, pero tiene componentes. Esto es para corregir el punto 4 de @Qmechanic.

Su perplejidad se aclararía si no usara índices para las funciones de coordenadas, sino que las llamara x, y y z. O incluso solo x e y. A menudo, dos dimensiones son suficientes para aclarar la mayoría de las cosas. Y olvídese de la convención de Einstein o los signos de suma, escriba las sumas explícitamente. El uso de índices para indicar varios objetos, en este caso funciones, puede causar una gran confusión con el uso de índices para indicar los diversos componentes del objeto. Cartan puso los índices debajo de la x, X i , porque estábamos pensando en norte diferentes objetos, no el norte componentes de un objeto. Las funciones con valores escalares no tienen ningún componente en absoluto....