Comprensión conceptual de los símbolos de Christoffel

Los vectores base en una variedad se definen como operadores de derivadas parciales de cualquier función que se puede mapear localmente alrededor de un punto para R norte . Los símbolos de Christoffel surgen cuando se diferencia un campo vectorial en una variedad de este tipo, y la regla del producto requiere diferenciar no solo los componentes, sino también estos vectores base, ya que cambian de un punto a otro.

¿Hay algún sentido, por tanto, en el que los símbolos de Christoffel puedan entenderse como una segunda derivada?

Su mejor apuesta es centrarse en ejemplos concretos en lugar de en abstracto. Considere las coordenadas polares en R 3 . Los símbolos de Christoffel son informáticos, por ejemplo, aquí . ¿Crees que se ven como una segunda derivada? Yo diría que no, pero la pregunta es bastante subjetiva.
@GiuseppeNegro Sí, ese es exactamente mi problema: los dos temas, es decir, la base covariante y los símbolos de Christoffel, se explican típicamente en dos capítulos o clases diferentes, y cuando se trata de símbolos de Christoffel, se usa un ejemplo menos abstracto como el que menciona. Entonces hace posible los cálculos, pero abandona un poco la idea abstracta.

Respuestas (3)

No, no son segundas derivadas de ningún tipo. Son los "coeficientes de expansión" para diferenciar un campo de vector base a lo largo de otro. La expresion X Y significa aproximadamente "diferenciar el campo vectorial Y a lo largo de la dirección X ". Ahora, uno puede considerar cualquier marco local { ξ 1 , , ξ norte } del paquete tangente, y en este sentido, considere ξ i ( ξ j ) . Este es nuevamente otro campo vectorial local, por lo que puede escribirse como una combinación lineal ξ i ( ξ j ) = Γ i j k ξ k para algunos Γ 's. Entonces Γ i j k nos dice el ξ k componente del cambio de ξ j a lo largo de ξ i ; pero este 'cambio' surge debido a una 'primera derivada'. En efecto, el hecho de que satisface la regla del producto es muy característico de las primeras derivadas.

No se confunda por el hecho de que los campos vectoriales base inducidos por coordenadas se pueden escribir como X i . Esto simplemente tiene que ver con una de las muchas formas equivalentes en que se define el espacio tangente a una variedad.


Editar en respuesta a los comentarios:

Ok, mi primera oración fue demasiado dura (vea la respuesta excelente y concisa de Deane para una interpretación, y más abajo para una interpretación de caso especial diferente), pero aún así, mantengo que en lo que respecta a los derivados de campos vectoriales/secciones de paquetes (que es principalmente por lo que se introducen las derivadas covariantes), no debe pensar en las segundas derivadas.

Suponer METRO es un suave metro subvariedad incrustada -dimensional de R norte , dejar ϕ : A ϕ [ A ] METRO R norte ser una parametrización local de METRO , dónde A R metro es un conjunto abierto (entonces ϕ es suave, un homeomorfismo sobre su imagen, y tiene derivada inyectiva en cada punto, todo en el sentido habitual del cálculo multivariable). Ahora bien, para cada pag ϕ [ A ] METRO , y cada i { 1 , , metro } definamos

ξ i ( pag ) := ( i ϕ ) ϕ 1 ( pag ) ϕ tu i | ϕ 1 ( pag ) R norte .
Este es un vector tangente a METRO en el punto pag ; vea esta respuesta en caso de que no se sienta cómodo relacionando las definiciones abstractas con cosas concretas en el especial R norte caso. Dejar , denote el producto interno estándar en R norte y definir para cada a , b { 1 , , metro } ,
gramo a b ( pag ) := ξ a ( pag ) , ξ b ( pag ) ,
y deja [ gramo a b ] denote la matriz inversa a [ gramo a b ] . Este gramo en realidad no es otro que el tensor métrico en METRO inducido a través del retroceso de la métrica RIemanniana estándar en R norte . Ahora, usando la conexión Levi-Civita en METRO , podemos deducir fácilmente que los símbolos de Christoffel son
Γ i j k ( pag ) = 1 2 gramo k s ( pag ) ( i ( gramo j s ϕ ) ϕ 1 ( pag ) + j ( gramo s i ϕ ) ϕ 1 ( pag ) s ( gramo i j ϕ ) ϕ 1 ( pag ) ) = gramo k s ( pag ) ( i j ϕ ) ϕ 1 ( pag ) , ( i ϕ ) ϕ 1 ( pag ) gramo k s ( pag ) 2 ϕ tu i tu j | ϕ 1 ( pag ) , ϕ tu s | ϕ 1 ( pag )
(la última igualdad es solo un cambio a la notación más clásica de Leibniz). Entonces, está bien, los símbolos de Christoffel correspondientes a la conexión Levi-Civita para una subvariedad incrustada, y correspondientes a una parametrización local, dependen de las segundas derivadas de la parametrización.

Habiendo dicho esto, he aquí por qué le recomiendo encarecidamente que no piense que solo por esto, los símbolos de Christoffel capturan las segundas derivadas.

  • Esto se basa en tener METRO estar incrustado en algunos R norte , y aprovechamos en gran medida que este es un espacio vectorial de producto interno (necesitábamos el producto interno de R norte y necesitábamos la estructura del espacio vectorial para diferenciar R norte -mapas valorados, a saber, la parametrización ϕ ). Sí, hay varios teoremas de incrustación (incluso los isométricos), por lo que, en cierto sentido, esto no es una pérdida de generalidad. Sin embargo, por lo general, se necesita un espacio ambiental de dimensiones mucho más altas (y cuanto más grande es el espacio ambiental, más información aparentemente superflua hay, lo que automáticamente dificulta el reconocimiento de las propiedades intrínsecas). También estamos hablando solo de la conexión Levi-Civita.

  • Desarrollando el comentario anterior, no se nos da una variedad general ya incrustada en R norte , y como tal, no tiene "vectores de posición", o como usé anteriormente, R norte parametrizaciones valoradas ϕ . Estas parametrizaciones no son las cantidades fundamentales. es decir, en los cursos básicos de matemáticas y física, primero aprendemos sobre distancias, luego aprendemos sobre posición/desplazamiento, y luego aprendemos sobre velocidad y luego sobre aceleración. Sin embargo, en geometría diferencial, el objeto fundamental es la variedad y sus diversos espacios tangentes (es decir, las velocidades son el objeto principal). Los "vectores de posición" son un concepto sin sentido a menos que ya esté incrustado. "velocidad" es un concepto adicional que solo puede tener sentido una vez que se tiene un tensor métrico, y finalmente las distancias/longitudes se obtienen integrando la velocidad de las curvas. Entonces, nuestro desarrollo lógico está muy invertido (esto es más general y más útil). Entonces, en la medida de lo posible,

  • Solo porque las segundas derivadas de ϕ aparecen en esta fórmula, no significa que el Γ son "efectos de segundo orden". Dada cualquier función suave F , decir R R , puedo encontrar una función F 1 tal que F 1 = F . Del mismo modo, puedo encontrar otra función. F 2 tal que F 2 = F . Para cualquier número entero positivo, puedo encontrar una función que, si se diferencia tantas veces, produce F . Entonces eso significa F debe ser considerado como un " 0 t h derivado" (ya que F ( 0 ) = F )? ¿O debería pensar en F como una "primera derivada" (ya que F 1 = F )? ¿Debería pensar en ello como una "segunda derivada" (ya que F 2 = F )? Lo mismo con el Γ 's. (El por otro lado, satisface la regla del producto, que es muy característica de las primeras derivadas, y la Γ aparecen simplemente debido al álgebra lineal, como los "coeficientes de expansión" relativos a una base).

  • Las conexiones de las que estamos hablando aquí se denominan más correctamente conexiones en T METRO (y las conexiones inducidas en los distintos haces tensoriales T s r ( T METRO ) ). Una situación un poco más general es que tiene un "paquete de vectores" ( mi , π , METRO ) . MUY aproximadamente hablando, esto significa que tenemos dos variedades suaves mi , METRO y un mapeo sobreyectivo π : mi METRO . La idea es que se trata de una "familia de espacios vectoriales que varía suavemente". Así que para cada pag METRO , tenemos un espacio vectorial mi pag := π 1 ( { pag } ) . Estos espacios vectoriales forman mi , es decir mi = pag METRO mi pag . Ahora, podemos considerar un " mi -campo vectorial", o más técnicamente una sección suave del paquete vectorial. Esto significa que consideramos un mapa ξ : METRO mi tal que π ξ = identificación METRO . Relajando las definiciones, esto solo significa en cada punto pag METRO tenemos un vector ξ ( pag ) mi pag en este espacio vectorial particular. Ahora, podemos preguntar qué significa tomar derivadas direccionales de un mapeo de este tipo donde el espacio objetivo consiste en no solo un espacio vectorial único como R norte , pero muchos de ellos. Tenga en cuenta que estos espacios vectoriales mi pag no es necesario que sean los espacios tangentes T pag METRO (entonces el ξ no tiene por qué tener nada que ver con X i ). Podrían ser algo completamente diferente. tampoco hay R norte Parametrizaciones valoradas por ahí, por lo que no se deben considerar las segundas derivadas de las parametrizaciones. Sin embargo, la cuestión de tal diferenciación parece bastante fundamental; podemos definir de una manera sencilla (la definición de Koszul para una derivada covariante, o podemos usar la definición mucho más geométrica de Ehresmann para finalmente llegar a ). E incluso en esta circunstancia general, el Γ Los 's pueden verse simplemente como una consecuencia algebraica lineal: son solo ciertos coeficientes en la expansión de elecciones relativas de bases.

El punto principal que deseo recalcar es que, a veces, la apariencia de ciertas cantidades cuando generalizamos la teoría nos dice cómo debemos interpretarla. Ya hemos encontrado tantos baches en el camino cuando tratamos de impartir esta interpretación de segunda derivada a la Γ 's. Entonces, con suerte, debería ser una motivación lo suficientemente fuerte como para que no sea una forma fructífera de pensar en ello.

Muy útil. Gracias. El último párrafo es el problema: estoy tratando de pensar en su primer ejemplo pero con la base local expresada como { X i } .
Esta es una pregunta completamente diferente, pero ahora estoy un poco confundido. En la conferencia de Frederic Schuller, presenta la derivada covariante como una construcción axiomática que no depende de nada más, pero en el libro de Pavel Grinfeld, lo hace simplemente mostrando lo que sucede cuando tomamos derivadas a lo largo de las líneas de cuadrícula... ¿cómo se relacionan estas dos?
@Buraian Tenga en cuenta que una variedad no tiene "vectores de posición", por lo que tratar de usar eso (intuitivo en R 3 , pero altamente engañosa) la noción no es realmente útil, y su confusión ilustra perfectamente por qué es tan engañosa.
En el libro, encuentra que en realidad se generaliza a una dimensión superior de alguna manera. No estoy seguro de dónde dijo eso ... déjame encontrarlo en realidad
la noción más intuitiva que puedo darte es considerar un incrustado metro subvariedad dimensional METRO R norte . Supongamos que tiene campos vectoriales X , Y definido en una vecindad abierta tu de METRO en R norte ; por lo que estos pueden verse como funciones suaves habituales X , Y : tu R norte . Entonces, puedes definir X Y ( pag ) tomando la derivada direccional usual D X Y ( pag ) := d d t | t = 0 Y ( pag + t X ( pag ) ) , y proyectándolo ortogonalmente a T pag METRO . Vea el libro de Lee para una discusión más clara.
Acabo de repasar el material de nuevo, y creo que entendí el asunto aquí. En realidad, decimos mucho cuando damos la parametrización exacta del vector de posición para dar puntos en la superficie. Los coeficientes de conexión saldrán naturalmente como resultado de la derivada. Al hacer el wya axiomático, estamos diciendo la menor cantidad posible de parada. No hablamos de coordenadas, vector de posición, etc., solo entregamos los christoffels al principio y decimos "usa esto para tomar las derivadas".
¿Estás de acuerdo con mi conclusión?
@Buraian correcto, y en particular si tiene un campo de tensor métrico gramo en el múltiple, entonces hay una forma "estándar" de "entregar" estos símbolos de Christoffel. Esto da lugar a la "conexión Levi-Civita" (la única conexión sin torsión compatible con métricas).
Muy groseramente, los símbolos de Christoffel son los componentes de la diferenciación del campo vectorial formado por un conjunto de vectores base a lo largo de esos mismos vectores base.
@Patti "son los componentes...", sí y un poco más precisos, son los componentes con respecto a ese mismo conjunto de vectores base.
Una pregunta final: ¿ve alguna contradicción entre su respuesta y el sonido menos radical ("No, no son segundas derivadas de ningún tipo). Edite la respuesta de Buraian? Eso suena genial, pero ¿tengo que elegir, o son la misma idea?
Y he publicado esto
@Patti ok, tal vez he sido demasiado duro en mi primera oración "no segundas derivadas de ningún tipo ". Realmente debería haber dicho que en situaciones especiales, uno puede interpretarlas como compuestas de segundas derivadas (respondiendo así afirmativamente a su pregunta), y luego debería haber seguido eso (como lo he hecho en mi edición ahora) pensando por qué en este enfoque no es realmente fructífero.
@Patti lol, incluso en mi comentario anterior, debería haber comenzado con "bueno, definitivamente he sido demasiado duro..." porque, como se señaló en la excelente respuesta de Deane, definitivamente puedes decir Γ i j k = i j 2 X k . Mi punto era principalmente que la definición de los símbolos de Christoffel se introduce principalmente desde una perspectiva de álgebra lineal: ciertos coeficientes de expansión, y que no es fructífero forzar una interpretación de segunda derivada a partir de esta definición. Así que sí, mis disculpas, debería haber redactado mi oración principal más claramente.

Los símbolos de Christoffel surgen de forma natural cuando se quiere diferenciar una función escalar F dos veces y queremos que el hessiano resultante sea un 2 -tensor. Cuando resuelves los detalles, descubres que con respecto a las coordenadas locales, la arpillera de F es dado por

i j 2 F = i j 2 F Γ i j k k F .
En particular, si establece F ( X ) = X k , usted obtiene
i j 2 X k = Γ i j k .

Además, observe que la arpillera de F siempre sera simetrico 2 -tensor si Γ i j k = Γ j i k , lo que equivale a decir que la conexión está libre de torsión. Esa es una de las razones por las que desea que la conexión Levi-Civita esté libre de torsión.

Buena respuesta, pero ¿no es esencialmente exactamente lo mismo que escribí? o_o
@Buraian, podría ser, pero no veo ninguna mención de Hessian de una función escalar en su respuesta. ¿Alguna posibilidad de que quieras dar más detalles?
Había mencionado la idea de tomar una derivada de un vector en una dirección. Cuando tomamos una derivada de un escalar en una dirección, tomamos un vector y lo punteamos en la dirección que queremos. Cuando tomamos la derivada de un vector en una dirección, tomamos una matriz y la multiplicamos por el vector que queremos. En mi respuesta, mencioné que hay una matriz de alguna manera, pero no los detalles, en la tuya, la única diferencia es que dijiste que es solo una arpillera.
@Buraian, los símbolos de Christoffel surgen de tomar solo una derivada de un campo vectorial. Pero para una función escalar, surgen solo después de haber diferenciado dos veces, en términos generales porque una derivada de una función es un campo vectorial (en realidad, un 1 -forma). Entonces, la única forma que conozco de hacer que un símbolo de Christoffel sea una segunda derivada de algo es hacer que ese algo sea una función escalar. Por otro lado, en tu respuesta solo veo derivadas de campos vectoriales.
solo un pequeño problema (que realmente no afecta el resto de su respuesta), pero creo que debería haber un signo menos i j 2 F = i j 2 F Γ i j k k F (porque ( d X k ) = Γ i j k d X i d X j )
@peek-a-boo, sí. Estás en lo correcto. Arreglaré eso. ¡Gracias!

Supongamos que tenemos un campo vectorial dependiendo en que punto estemos en el espacio v = v i mi i , los Christtofel aparecen naturalmente cuando tomamos la derivada del vector con la parametrización de la coordenada. Son algo así como una 'derivada espacial' de los vectores base.

¿Qué quiero decir con eso? Suponga que se mueve de un punto de la superficie a otro, entonces el campo vectorial en la superficie puede cambiar debido a dos razones:

  1. Cambio en el componente del vector
  2. Cambio de base

El cambio en la parte de la base es lo que Christoffel intenta capturar.

Supongamos que me muevo de un punto a A apuntar B , a lo largo de una cuadrícula de coordenadas:

mi i ( B ) mi i ( A ) Γ i k yo mi yo d λ

Tenga en cuenta que estoy pensando en eso B es el punto en el valor del parámetro λ + d λ y A es el punto en el valor del parámetro λ en las líneas de cuadrícula. Para un valor particular de i , podemos pensar en RHS como una matriz que se multiplica en los vectores unitarios para decir cuál es el cambio en esa base a medida que avanzamos a lo largo de la línea de cuadrícula.


Además, supongo que son una especie de segundas derivadas. En el libro de análisis de tensores de Pavel Grinfeld, habla de cómo, dada una parametrización de una superficie, conocemos automáticamente el vector tangente de la superficie por diferenciación del vector de posición.

Por ejemplo, consideremos una esfera:

R ( a , θ , ϕ ) = a pecado θ porque ϕ i ^ + a pecado ϕ s i norte θ j ^ + a porque θ k ^

Si diferencia el vector anterior con las coordenadas, podemos obtener dos vectores tangentes en un punto, es decir: mi θ = R θ y mi ϕ = R ϕ . El Christoffel estaría entonces relacionado con la segunda derivada del vector de posición (siguiendo la ecuación anterior con la que introduje los símbolos).

mi r = R r = ( pecado θ porque ϕ , pecado ϕ pecado θ , porque θ )

mi ϕ = a pecado θ ( pecado ϕ , porque ϕ )

mi r ϕ = pecado θ ( pecado ϕ , porque ϕ ) = mi ϕ a

Esta ecuación anterior nos dice sobre el Christoffel Γ r ϕ i para { r , θ , ϕ } nos dice que r y ϕ las entradas son cero y θ la entrada es 1 a

En el punto de tomar la derivada del vector en direcciones: math.stackexchange.com/a/4359170/688539
Si ha pasado por esta respuesta y desea ver la conexión con la definición axiomática de la derivada covariante, consulte el intercambio en la respuesta de peek-a-boo
La edición tocó directamente la pregunta. Ty. ¿Está de alguna manera en contradicción con la otra respuesta de peekaboo? ¿Cómo conciliar ambas respuestas?
Por el bien del curso de Pavel, lo que dice mi respuesta será suficiente información para completar el curso hasta el final. Es como la noción ingenua de cálculo que tenemos en la física de HS. En aras de una Geometría diferencial rigurosa, damos menos por sentado y debemos ser más cuidadosos. @Patti
Hola, @JAP, agregué un cálculo concreto que puede ayudarte a ver lo que quiero decir y también para futuras personas.