Derivar el gradiente vectorial en coordenadas esféricas a partir de los primeros principios

Tratando de entender dónde está el 1 r s i norte ( θ ) y 1 / r los bits vienen en la definición de gradiente .

He derivado los vectores unitarios esféricos pero ahora no entiendo cómo transformar del cartesiano en del todo esférico. La gente sigue diciendo que use la regla de la cadena, ¡pero no la veo!

¿Alguna ayuda?

Creo que la forma de derivarlos de verdaderos primeros principios debería implicar retirar la métrica de R 3 al incrustar S 2 ... Una forma quizás menos fundamental pero igualmente satisfactoria de hacer las cosas es definir X , y , z en términos de r , θ , ϕ y trabajando desde allí.
Quiero decir, ¿cómo haces para convertir cartesianas en polares esféricas?
¿ Math.stackexchange.com sería un mejor lugar para esta pregunta?
@Qmechanic En Australia, aprendemos esta identidad en Física universitaria de segundo año. Ahora mismo estoy jugando con la derivación, ya que sé cómo hacerlo usando un resultado general de matemáticas puras, pero encontrar una derivación sin usar ese nivel de abstracción podría ser de interés para el estudiante de física general. ¿Cómo se traza la línea entre las matemáticas y la física? No sin mucha sangre en la alfombra, creo.

Respuestas (3)

Usted pidió una prueba de "primeros principios". Hagamoslo. Resaltaré las fuentes de errores más comunes y luego mostraré una prueba alternativa que no requiere ningún conocimiento de cálculo tensorial o notación de Einstein.

El camino difícil

Primero, la convención de coordenadas:

( r , θ , ϕ ) ( X , y , z ) = ( r pecado θ porque ϕ , r pecado θ pecado ϕ , r porque θ )

De la misma manera podemos expresar ( X , y , z ) como X mi ^ X + y mi ^ y + z mi ^ z , también podemos expresar ( r , θ , ϕ ) como r mi ^ r + θ mi ^ θ + ϕ mi ^ ϕ , pero ahora los coeficientes no son los mismos: ( r , θ , ϕ ) ( r , θ , ϕ ) , en general. Esto se debe a que las coordenadas esféricas son curvilíneas , por lo que los vectores base no son los mismos en todos los puntos. Sin embargo, para pequeñas variaciones, son muy similares. Más precisamente, relativo a un punto pag 0 = ( X , y , z ) , un punto vecino pag 1 = ( X + Δ X , y + Δ y , z + Δ z ) puede ser descrito por Δ pag = ( Δ X , Δ y , Δ z ) y, en coordenadas esféricas, si esta variación es "infinitesimal", entonces d pag = ( d r , d θ , d ϕ ) = d r mi ^ r + d θ mi ^ θ + d ϕ mi ^ ϕ . Esta es básicamente la motivación para definir la base (no normalizada) como:

mi r = pag r , mi θ = pag θ , mi ϕ = pag ϕ

Pero esto aún no está normalizado. Coincidentemente, | | pag / r | | resulta ser 1 , pero | | pag / θ | | = r , como veremos. Entonces, la base real debe definirse como:

mi ^ r = mi r | | mi r | | , mi ^ θ = mi θ | | mi θ | | , mi ^ ϕ = mi ϕ | | mi ϕ | |

Explícitamente:

mi r = ( pecado θ porque ϕ , pecado θ pecado ϕ , porque θ ) mi θ = ( r porque θ porque ϕ , r porque θ pecado ϕ , r pecado θ ) mi ϕ = ( r pecado θ pecado ϕ , r pecado θ porque ϕ , 0 )

| | mi r | | 2 = pecado 2 θ ( porque 2 ϕ + pecado 2 ϕ ) + porque 2 θ = 1 | | mi θ | | 2 = r 2 porque 2 θ ( porque 2 ϕ + pecado 2 ϕ ) + r 2 pecado θ = r 2 | | mi ϕ | | 2 = r 2 pecado 2 θ ( pecado 2 ϕ + porque 2 ϕ ) = r 2 pecado 2 θ

mi ^ r = mi r = ( pecado θ porque ϕ , pecado θ pecado ϕ , porque θ ) mi ^ θ = mi θ / r = ( porque θ porque ϕ , porque θ pecado ϕ , pecado θ ) mi ^ ϕ = mi ϕ / ( r pecado θ ) = ( pecado ϕ , porque ϕ , 0 )

Puede verificar que esto también forma una base ortogonal (por lo tanto, ortonormal). Por ejemplo:

mi ^ r mi ^ θ = pecado θ porque θ porque 2 ϕ + pecado θ porque θ pecado 2 ϕ pecado θ porque θ = 0

Eso no tiene por qué suceder en general.

Para pasar de un conjunto de coordenadas al otro usando los vectores base, resolvemos:

[ mi ^ r mi ^ θ mi ^ ϕ ] = [ pecado θ porque ϕ pecado θ pecado ϕ porque θ porque θ porque ϕ porque θ pecado ϕ pecado θ pecado ϕ porque ϕ 0 ] [ mi ^ X mi ^ y mi ^ z ]

para mi ^ X , mi ^ y , y mi ^ z en términos de mi ^ r , mi ^ θ , y mi ^ ϕ . Entonces cualquier vector pag = X mi ^ X + y mi ^ y + z mi ^ z se puede escribir en la forma r mi ^ r + θ mi ^ θ + ϕ mi ^ ϕ por simple sustitución. Dado que esta base en particular es ortonormal, hay una forma alternativa: simplemente use el producto escalar. Por ejemplo, para obtener r :

pag mi ^ r = r mi ^ r mi ^ r + θ mi ^ θ mi ^ r + ϕ mi ^ ϕ mi ^ r = r

Ahora al gradiente. Usando la notación matricial, podemos escribir el gradiente como un vector fila y la fórmula para la regla de la cadena se convierte en:

F = [ F X F y F z ] = [ F r F θ F ϕ ] [ r X r y r z θ X θ y θ z ϕ X ϕ y ϕ z ]

Llame a la matriz de la derecha j (es la matriz jacobiana ). Tenga en cuenta que esto también funciona al revés:

[ F r F θ F ϕ ] = [ F X F y F z ] [ X r y r z r X θ y θ z θ X ϕ y ϕ z ϕ ]

Y llama a esta otra matriz j . Podemos invertir la primera ecuación para obtener F j 1 = F j F ( j 1 j ) = 0 . Dado que esto funciona para un arbitrario F , tenemos j 1 j = 0 j = j 1 . Una consecuencia importante es que, en general:

a b ( b a ) 1

Parece que el OP cometió este error en un comentario , confundiendo r / X con ( X / r ) 1 = 1 / ( pecado θ porque ϕ ) , como sería el caso si estuviéramos usando derivadas regulares (en lugar de parciales).

Ahora tenemos dos formas de calcular la matriz. j . Directamente o calculando j primero y luego invirtiéndolo. Hagámoslo directamente. Vamos a necesitar las expresiones para r , θ , y ϕ en términos de X , y , y z (para otros sistemas de coordenadas esto puede ser muy difícil de obtener):

r = X 2 + y 2 + z 2 θ = arcán ( X 2 + y 2 z ) ϕ = arcán ( y X )

Las derivadas parciales son:

r X = X X 2 + y 2 + z 2 = pecado θ porque ϕ r y = y X 2 + y 2 + z 2 = pecado θ pecado ϕ r z = z X 2 + y 2 + z 2 = porque θ

θ X = z X X 2 + y 2 ( X 2 + y 2 + z 2 ) = porque θ porque ϕ r θ y = z y X 2 + y 2 ( X 2 + y 2 + z 2 ) = porque θ pecado ϕ r θ z = X 2 + y 2 X 2 + y 2 + z 2 = pecado ϕ r

ϕ X = y X 2 + y 2 = pecado ϕ r pecado θ ϕ y = X X 2 + y 2 = porque ϕ r pecado θ ϕ z = 0 = 0

Nuestro jacobiano es entonces:

j = [ pecado θ porque ϕ pecado θ pecado ϕ porque θ porque θ porque ϕ r porque θ pecado ϕ r pecado ϕ r pecado ϕ r pecado θ porque ϕ r pecado θ 0 ]

Alternativamente, podríamos haber calculado el jacobiano inverso (lo cual es sencillo) y luego lo invertimos (lo cual es una pesadilla). Podemos usar Wolfram Alpha para confirmar que da el mismo resultado:

Entrada y resultado de Wolfram Alpha

Finalmente, usamos el producto escalar para encontrar los coeficientes r , θ , y ϕ :

r = F mi ^ r = [ F r F θ F ϕ ] j [ pecado θ porque ϕ pecado θ pecado ϕ porque θ ] = [ F r F θ F ϕ ] [ 1 0 0 ] = F r

θ = F mi ^ θ = [ F r F θ F ϕ ] j [ porque θ porque ϕ porque θ pecado ϕ pecado θ ] = [ F r F θ F ϕ ] [ 0 1 / r 0 ] = 1 r F θ

ϕ = F mi ^ ϕ = [ F r F θ F ϕ ] j [ pecado ϕ porque ϕ 0 ] = [ F r F θ F ϕ ] [ 0 0 1 / ( r pecado θ ) ] = 1 r pecado θ F ϕ

Por lo tanto:

F = F r mi ^ r + 1 r F θ mi ^ θ + 1 r pecado θ F ϕ mi ^ ϕ


Una manera mucho mejor

Vamos a necesitar una nueva notación para evitar tener que usar letras diferentes para X , y , y z , Por ejemplo. En su lugar, usemos índices de 1 a 3 . Para coordenadas cartesianas usaremos la letra X , y para coordenadas esféricas usaremos la letra r . Lo siguiente debería explicarse por sí mismo:

pag = i X i X ^ i = k r k r ^ k

De la definición de los vectores base:

r k = pag r k , r ^ k = r k | | r k | | = 1 h k pag r k

Dónde h k | | r k | | . Expansión en el X base:

r ^ k = j 1 h k X j r k X ^ j

Ahora el gradiente es solo:

F = F = i F i X ^ i = i F X i X ^ i

Para obtener el k 'ésima componente en coordenadas esféricas ( F k ), utilice el producto escalar:

F k = F r ^ k = ( i F X i X ^ i ) ( j 1 h k X j r k X ^ j ) = 1 h k i F X i X i r k = 1 h k F r k

y hemos terminado.

¡Muchas gracias! Aclaró mucha confusión en mi cabeza, especialmente la distinción entre la matriz jacobiana y la de cambio de base, que son similares en forma e idea y bastante confusas. Además, gracias por abrirme los ojos sobre la diferencia entre coordenadas y componentes.
Por cierto, ¿sería cierta la última fórmula también para bases no ortogonales?
@JonasDaverio No, porque los productos de puntos solo dan proyecciones ortogonales. Si miras los coeficientes 1 h k X j r k , podrías escribir eso como una matriz. En el caso general, tendrías que usar la transposición inversa de eso. En el caso ortogonal, la transpuesta inversa pasa a ser la propia matriz.
Ah, sí, estás hablando del tensor métrico, ¿eso es escribir? Como es diagonal para bases ortogonales, el inverso permanece diagonal.
Muy bien respondido. No sé por qué esta respuesta no está en la parte superior.
¿Cómo se reduce la última línea a la forma deseada?
@usuario143 F = k F k r ^ k = k 1 h k F r k r ^ k , luego ingrese los valores para cada índice, por ejemplo: h 1 | | r 1 | | = | | mi r | | = 1 etcétera. deberías conseguir F = 1 1 F r mi ^ r + 1 r F θ mi ^ θ + 1 r pecado θ F ϕ mi ^ ϕ .
Ah genial, gracias!

Nosotros tomamos:

X = r pecado θ porque ϕ
y = r pecado θ pecado ϕ
z = r porque θ

Ahora ya conoces la definición del gradiente en coordenadas cartesianas: = X X ^ + y y ^ + z z ^

Ahora, usamos la regla de la cadena o cada componente. Por ejemplo,

X = r X r + θ X θ + ϕ X ϕ

Después de un montón de álgebra engorrosa, esto te dará la forma correcta.

¿Qué parte sale mal?
yo obtengo X = 1 s i norte ( θ ) C o s ( ϕ ) r + 1 C o s ( θ ) C o s ( ϕ ) θ 1 s i norte ( θ ) s i norte ( ϕ ) ϕ !
Y luego, ¿cómo se reemplazan los vectores de sombrero?
deberías expresar r , θ , ϕ en términos de solo X , y , z
¿Cómo haces eso? ¡Parece que no puedo separarlos en los parciales!
¡Deberías poder hacerlo a partir de un dibujo! Pruebe, por ejemplo, esta imagen: plaza.obu.edu/corneliusk/mp/suv.pdf . Por cierto, la forma de convertir vectores unitarios se da allí, ¡pero TAMBIÉN se puede derivar simplemente mirando la imagen con cuidado!
Eso realmente no me ayuda.

Se sigue de la definición general del gradiente como

F ( pag ) | v = d pag F ( v ) = i F X i | pag d X i ( v )
donde p es un punto en el espacio y va un vector en el espacio tangente. La suma se realiza sobre los vectores base del espacio tangente. Puede intentar expandir esta expresión para obtener el resultado final del componente. i
( F ) i = 1 h i F X i
Esta es la fórmula más útil. La cantidad h i es el módulo de la i el vector tangente.

Ejemplo: desea calcular el gradiente en coordenadas esféricas. La base del espacio tangente es { r , θ , ϕ } . Desde

θ 2 = X θ X + y θ y + z θ z 2 = r 2 porque 2 θ porque 2 ϕ X 2 = 1 + r 2 porque 2 θ pecado 2 ϕ y 2 = 1 + r 2 pecado 2 θ z 2 = 1 = r 2
Así obtenemos
h θ = θ = r
Con el mismo espíritu puedes calcular que
h r = 1 y h ϕ = r pecado θ
dándonos el gradiente en coordenadas esféricas
F = F r mi ^ r + 1 r F θ mi ^ θ + 1 r pecado θ F ϕ mi ^ ϕ

Prueba del primer paso

Expandir el vector | F en términos de vectores base

| F = i ( F ) i | mi i = i ( F ) i 1 h i | X i
Aquí es básicamente donde el factor h i viene de. ahora toma v = | X k e insértelo en la primera expresión dada arriba. Tenga en cuenta que por definición de un vector dual obtenemos d X i ( | X k ) = d k i . El lado izquierdo es
F | X k = i ( F ) i 1 h i X i | X k = i ( F ) i 1 h i h i 2 d i k = ( F ) k h k
Mientras que el lado derecho
i F X i | pag d X i ( | X k ) = i F X i | pag d k i = F X k
Al comparar ambas expresiones se obtiene la afirmación.

Gran respuesta, mucho mejor que la mía. Sin embargo, no estoy seguro de que el autor de la pregunta se sienta cómodo con este nivel de abstracción (el espacio tangente, por ejemplo, podría ser un concepto desconocido).
Buena respuesta, he leído sobre este método antes, pero lo simplificaste y entiendo casi todo. De hecho, trabajé en esto al derivar vectores unitarios esféricos. Solo una cosa: ¿cómo pasas de la definición general en la parte superior a tu segunda expresión? ¿De dónde viene esto? h ¿viene de?
¿Y por qué h θ = | | θ | | ?
Acabo de agregar una prueba para el primer paso. h θ = θ por definición, es simplemente el módulo del vector tangente θ
@Stan, estoy siguiendo un curso de GR y parece que no puedo comprender la siguiente parte de la solución: por lo que parece entender hasta ahora, su segunda fórmula obtiene este factor de 1 h , debido a un factor de 1 h 2 primero, procedente de la métrica, y un factor de h después de eso, para pasar de vectores tangentes a una base ortonormal. El módulo del vector tangente siempre será positivo, ¿no? Entonces se podría haber encontrado una base ortonormal diferente donde ϕ es tal que el componente theta de la divergencia dice 1 r | pecado θ | ¿Cómo puedo verificar que el tan
@Stan, ¿puedes explicar cómo obtienes la expansión? ( F ) i = 1 h i F X i ? Muchas gracias.
Se explica en la segunda parte de la respuesta en "Prueba para el primer paso". La razón es que los vectores base que elija no son necesariamente de longitud unitaria. Esto es particularmente cierto para las coordenadas esféricas. Vea la segunda parte de mi respuesta para más detalles.
@Stan hola, veo pero no entiendo por qué mi i = 1 h i X i , normalmente mi i se define como sin el 1 / h i función..
Hola marion. ¡Porque las componentes del gradiente están definidas con respecto a una base donde los vectores están normalizados!