Intuición detrás de los operadores diferenciales como vectores base de una variedad (espacio-tiempo)

Entiendo que para proporcionar una base para cada punto en el espacio-tiempo, los operadores diferenciales , m (u operador de derivada parcial con respecto a cada una de las coordenadas curvilíneas en la variedad, es decir { X 0 , X 1 , X 2 , X 3 } ) normalmente se eligen.

La función real, F , no se establece explícitamente, pero se entiende que habría un operador lineal sería coeficientes A m , tal que en cualquier punto pag

A m m F | pag

m son la base de coordenadas.

La base del espacio dual V son la forma diferencial d X m , tal que cuando la base de V son "alimentados" en la base del dual, X m d X v = d m v .

Entiendo esta idea, pero tengo problemas para visualizar m como vectores de flecha. ¿Hay ayudas visuales?

La idea es que quieras definir vectores sin usar un espacio ambiental. Así que los defines como operadores derivados cuyas funciones dan la derivada direccional en la dirección que representa el vector que se está definiendo. El vector base de coordenadas m de un gráfico ( tu , X ) es solo la derivada a lo largo de la línea de coordenadas X m .
el vector tu se puede identificar con el operador tu y luego m es una base

Respuestas (2)

Un vector de flecha en el espacio euclidiano es esencialmente un operador de traducción. Por lo general, el espacio euclidiano se considera un espacio vectorial en sí mismo (por ejemplo, puntos = vectores), pero el espacio euclidiano es un espacio lineal (vector) solo si elige un origen, que es una estructura innecesaria (en el espacio euclidiano, todos los puntos son iguales , no hay razón para elegir uno como único).

Un espacio vectorial, cuyo "origen se olvida" es lo que se denomina un espacio afín. En un espacio afín, los puntos no son equivalentes a los vectores. Los vectores proporcionan traducciones de puntos a otros puntos. No mencionaré los axiomas reales que definen un espacio afín preciso, es solo que quiero que pienses en los puntos como... bueno, puntos y vectores como traslaciones.

Dejar F sea ​​una función suave en el espacio euclidiano, y sea a ser un vector El punto PAG puede ser traducido por a en PAG + a . La traducción actúa sobre la función mediante un operador. T ^ a como

( T ^ a [ F ] ) ( PAG ) = F ( PAG + a ) .
Si ϵ es un "infinitesimal", entonces F ( PAG + ϵ a ) se expande como
F ( PAG + ϵ a ) = F ( PAG ) + F X m | X = PAG a m ϵ + O ( ϵ 2 ) ,
pero F ( PAG + ϵ a ) = ( T ^ ϵ a [ F ] ) ( PAG ) , entonces el operador que traduce por ϵ a se da como
T ^ ϵ a = 1 + ϵ a m X m .

Esto muestra que cuando consideras un vector como una flecha infinitesimal , que describe un desplazamiento infinitesimal , es natural pensar en esto como un operador diferencial.

Una variedad es solo infinitesimalmente como el espacio euclidiano, por lo que esta es la interpretación principal de los vectores en geometría diferencial.

Entonces, lo más abstracto que está sucediendo aquí es que estamos definiendo campos vectoriales como las derivaciones en la variedad. Suponga que tiene un conjunto de campos escalares S ( METRO R ) sobre la variedad que decidimos llamar "lisa". Para formalizar esto requerimos el cierre de S bajo C ( R norte , R ) funciones, donde la interpretación de estas como S norte S funciones es aplicándolas puntualmente,

F [ s 1 ,   s norte ] ( pag ) = F ( s 1 ( pag ) ,   s norte ( pag ) ) ,
dónde pag es un punto en la variedad METRO . En particular i s i tiene sentido como pag i s i ( pag ) y s 1 s 2 tiene sentido como pag s 1 ( pag )   s 2 ( pag ) , pero el punto es que el cierre se aplica a todas las funciones suaves. Este conjunto S se convierte también en la topología en el espacio: decimos que un conjunto es cerrado cuando es el kernel (conjunto de puntos mapeados a cero) de un campo escalar; podemos probar que esta es una topología de conjunto cerrado válida a través del axioma de cierre anterior. (Es por eso que elegir S = METRO R es una mala idea, el axioma de cierre trivial es bueno pero obtienes la topología discreta para el espacio).

La definición de las derivaciones es que son mapas V ( S S ) que obedecen la ley de Leibniz. Dejar F ( i ) denote la derivada parcial de F con respecto a su i el argumento, manteniendo sus otros argumentos constantes: para que no tengamos que luchar con expresiones simbólicas. La ley de Leibniz generalizada es que para todo V V y para todos F C ( R norte , R ) tenemos

V ( F [ s 1 ,   s norte ] ) = i = 1 norte F ( i ) [ s 1 ,   s norte ]   V s i .
Tomamos esta definición porque es completamente independiente de las coordenadas. Ni siquiera he definido qué son las coordenadas todavía, y sé qué son las derivaciones.

Coordenadas

Pero la mejor intuición que puedo darte por qué esto definiría un módulo que se corresponde estrechamente con lo que piensas que son vectores proviene de la introducción de coordenadas, así que hagámoslo. El axioma de coordenadas dice que sobre cualquier punto pag hay un conjunto abierto de puntos y un conjunto de D campos escalares en S , llamémoslos C 1 , C D , que se puede usar para distinguir los puntos en el conjunto entre sí: y todos los demás campos escalares s puede, en este conjunto abierto, ser representado como uno de estos C ( R D , R ) funciones suaves aplicadas al campo de coordenadas.

Afirmé que esto aclararía la conexión entre las derivaciones lineales de Leibniz V y el sentido ordinario de un espacio vectorial. Aunque la derivación tiene un significado independiente de las coordenadas, cuando usamos estas coordenadas en la vecindad de un punto encontramos que

V ( s ) = V ( s [ C 1 ,   C D ] ) = i = 1 D s ( i ) [ C 1 ,   C D ]   V C i .
Ahora, si observamos lo anterior, nos damos cuenta de que en este conjunto abierto la derivación está realmente definida, en términos de lo que hace, por D diferentes componentes de campo escalar suave v i = V C i , y toda su acción sobre el conjunto abierto se sigue de esos componentes. Entonces localmente vemos que una derivación es isomorfa a una tupla S D , y lo único "extra" que estamos imponiendo es que el campo vectorial tenga alguna "existencia independiente" en todos los puntos.

Entonces, esta propiedad nos devuelve, o al menos a mí, a mi primera clase de álgebra lineal donde mi profesor de matemáticas me mintió un poco, diciendo "vamos a definir que un vector es solo una lista de números". Ahora es un campo vectorial y en cada punto hay un vecindario donde el campo vectorial es una lista de campos escalares , pero es lo más cercano que podemos llegar a esa definición de estudiante de primer año en la universidad. Pero aquí también está pasando otra cosa.

Entonces, dados dos puntos cercanos pag , pag + d pag y algún campo escalar s hay una pequeña variación d s entre esos dos puntos, y el axioma de coordenadas nos permite escribir esto como

d s = s ( C 1 ( pag + d pag ) ,   C D ( pag + d pag ) ) s ( C 1 ( pag ) ,   C D ( pag ) ) .
Pero en primer orden vamos a tener que los campos de coordenadas son diferentes por algunos pequeños d C i y obtendremos la expresión
d s = i d C i   s ( i ) [ C 1 ,   C D ] ( pag ) .
Es un poco impreciso porque ahora tenemos que "levantar" estos d C i a ser campos escalares (en este momento son solo números) e insisten en que el campo se puede extender consistentemente fuera de este conjunto abierto, pero: en cierto sentido, este conjunto i d C i   s ( i ) [ C 1 ,   C D ] es precisamente lo que queremos decir cuando decimos "vamos a ver lo que sucede localmente cuando traducimos sobre el espacio en un cierto desplazamiento definido por estos d C i ." En ese sentido, una derivación es una "derivada direccional", y dado que tiene tanto una escala como una "dirección local", es una cantidad "vectorial".

Ejemplo: trabajar en el 2 -esfera

Creo firmemente que aprendemos con ejemplos, así que permítanme dar uno con una estructura no trivial.

Entonces, por ejemplo, en la esfera 2D que es el borde de la bola de la unidad 3D, METRO = { ( X , y , z ) : X 2 + y 2 + z 2 = 1 } , un lugar natural es comenzar con los campos escalares X ( pag ) , y ( pag ) , z ( pag ) que nos dan las coordenadas de un punto en esta bola. Entonces decimos que S son las funciones suaves C ( R 3 , R ) , interpretado aquí como F [ X , y , z ] en nuestros tres campos escalares suaves iniciales.

Ahora tomamos el Polo Norte norte = ( 0 , 0 , 1 ) como nuestro punto y queremos coordenadas para distinguir los puntos cercanos. Encuentro que podemos elegir el conjunto abierto para que sea el hemisferio de todos los puntos al norte del ecuador, y en este hemisferio X , y son campos de coordenadas perfectamente buenos: dado que solo necesitamos dos de ellos, sabemos que es una variedad bidimensional; todos los demás campos son funciones suaves F norte ( X , y ) = F ( X , y , 1 X 2 y 2 ) en este conjunto abierto.

También puedo señalar que con la definición anterior el ángulo aximutal θ no es un campo escalar uniforme; no hay manera de obtener esa discontinuidad entre θ 0 + contra θ 2 π resuelto con una función suave de X , y , z . (El ángulo polar ϕ está bien, siendo un arcotangente de z .) Pero todavía podemos pensar en estos campos como F ( pecado ϕ   porque θ ,   pecado ϕ   pecado θ ,   porque ϕ ) y tomar una derivada con respecto a θ tenencia ϕ constante a través de la regla de la cadena,

F F ( 1 ) ( )   pecado ϕ pecado θ + F ( 2 ) ( )   pecado ϕ porque θ .
Sustituyendo tenemos V ( F [ X , y , z ] ) = y   F ( 1 ) [ X , y , z ] + X   F ( 2 ) [ X , y , z ] y esa es una derivación perfectamente válida: / θ es una derivación aunque θ no es un campo escalar suave.

la acción de / θ en algunos "coordinados" F norte por el contrario, parece abrumadoramente complicado al principio: los únicos argumentos aquí son X y y e intrínsecamente por lo tanto no podemos detener estos derivados F ( 3 ) de entrar a través de la regla de la cadena. Darse cuenta de F ( 3 ) ¡Ciertamente no viene arriba, por lo que esto generaría una inconsistencia matemática real! Pero recuerda lo que dije anteriormente: todo lo que tenemos que hacer para obtener la acción de V = / θ en este conjunto abierto que contiene norte es averiguar V C 1 , 2 . Lo sabemos V X = y y sabemos que V y = X , entonces esa es la respuesta; la operación en F norte es

V ( F norte [ X , y ] ) = y   F ( 1 ) norte [ X , y ] + X   F ( 2 ) norte [ X , y ] .
Entonces ambos podemos ver por qué mis preocupaciones sobre F ( 3 ) son inmateriales: si ampliamos esto en términos de F encontramos y X F ( 3 ) + X y F ( 3 ) que se cancelan. Los campos componentes y ( pag ) , X ( pag ) realmente son todo lo que necesitamos saber sobre este derivado θ en el hemisferio norte: y especifican en cualquier punto dado una "dirección local" que convierte esto en un derivado direccional.

Punto menor que completa la teoría.

Solo queda definir que s = V V s .

En palabras, ahora que estamos diciendo que las derivaciones son lo que queremos decir cuando hablamos de "campos vectoriales", nos interesamos mucho en los campos covectoriales . V ¯ : estos son los mapas lineales desde campos vectoriales hasta campos escalares. Un [ metro , norte ] -tensor será entonces un mapa multilineal ( V ¯ metro , V norte ) S de metro campos de covectores y norte campos vectoriales a un campo escalar: pero postularemos como axioma que todo [ metro , norte ] -tensor se puede representar como una lista finita de tuplas de metro campos vectoriales y norte campos covectoriales, siendo su acción sobre los campos previamente especificados básicamente "tomar cada tupla de ( V metro , V ¯ norte ) , aplicarlo a los campos de entrada ( V ¯ metro , V norte ) Llegar metro + norte campos escalares S metro + norte , luego multiplique todos estos juntos en un campo escalar en S . Haga esto para cada tupla en la lista y luego sume la lista para obtener nuestro resultado final en S ." A partir de aquí podemos hablar de tensores métricos y tensores de orientación.

Esta es nuestra álgebra tensorial y podemos reconocer inmediatamente que, dado un campo escalar s , podemos promoverlo a un campo covector s basado en la idea de que se necesita un campo vectorial V y lo aplica a s para formar el campo escalar V s .

Una cosa que curiosamente no está bien definida es la acción de en un campo vectorial, lo cual es suficiente para definirlo sobre todo el espacio de operaciones tensoriales ya que esperamos que las propiedades de Leibniz guíen nuestro camino y sabemos cómo debe actuar sobre escalares. (Por ejemplo, la operación de en covectores debe definirse como m   tu α = v α m ( tu α v α ) tu α   m v α ; el lado derecho de eso solo se aplica a un escalar y un vector.) Pero resulta que esta elección de es ambiguo hasta un [ 1 , 2 ] -tensor, y tenemos que postular cosas como m gramo α β = 0 y m v v m = 0 para definir uno inequívoco, la "conexión Levi-Civita", a través del espacio.