Derivada de una función compuesta R→Rn×n→RR→Rn×n→R\mathbb{R} \to \mathbb{R}^{n\times n} \to \mathbb{R}

tengo una matriz de rotacion R R 3 × 3 que es una función de cierto parámetro angular α .

Los ángulos de balanceo-cabeceo-guiñada se pueden extraer de la matriz, a través de algunas funciones trigonométricas de sus entradas.

Por ejemplo, uno de esos ángulos ϕ es entonces una función de la matriz R , es decir ϕ = F ( R ) .

tengo que calcular la derivada de ϕ con respecto a α :

d ϕ ( α ) d α = d F ( R ( α ) ) d α

¿Cómo puedo calcular esta derivada?

La siguiente regla de la cadena

d ϕ ( α ) d α = d F ( R ( α ) ) d R ( α ) d R ( α ) d α
no se puede aplicar, porque ambas derivadas son matrices de 3x3 mientras que el resultado es, por supuesto, un escalar.

Todo lo que tengo es la expresión de la función. F y la derivada de la matriz con respecto al ángulo

d R ( α ) d α = S ( d ) R ( α )
dónde S ( d ) es una matriz simétrica oblicua asociada al producto vectorial:
S ( d ) v = d × v
y, por supuesto, alguna información sobre la estructura, como R 1 = R T o det ( R ) = 1

EDITAR:

Como temía, y como confirmó el comentario de Bill Wallis, la derivada puede ser simple usando la vectorización

r := ( C 1 C 2 C 3 )
dónde
R = ( C 1 C 2 C 3 )
por lo que la derivada es simplemente el producto escalar entre dos vectores, lo que equivale a considerar todas las entradas como funciones separadas:

d ϕ ( α ) d α = i = 1 3 j = 1 3 d ϕ d r i j d r i j d α

En cualquier caso, todavía me pregunto si podría existir una regla de cadena razonable para derivadas que involucren matrices, porque esta solución no permite explotar la información que ya tengo sobre la derivada de la matriz.

Intenta identificar R norte × norte con R norte 2 . Entonces tus derivadas serán 9 × 1 y 1 × 9 matrices, cuya composición (si lo haces al revés) será un solo valor con 9 términos en él.
@BillWallis Vea mi pregunta revisada, por favor.
Asi es R = R ( θ ) , o es R = R ( α ) ? o es el θ en su oración de apertura un error tipográfico, y debe ser reemplazado por un α .
@greg, por supuesto que es un error tipográfico.

Respuestas (2)

Para comodidad de escritura, deje

GRAMO = ϕ R
También sabemos que el diferencial de R en términos de α es
d R = S R d α
Use estas dos piezas de información para encontrar el diferencial de ϕ y luego su gradiente
d ϕ = GRAMO : d R = GRAMO : S R d α d ϕ d α = GRAMO : S R
donde se usan dos puntos para denotar el producto traza/Frobenius, es decir A : B = t r ( A T B )

Me gusta su enfoque de la diferenciación de matrices complejas. ¿Podría darme una referencia de las dos definiciones que usó para probar el resultado, a saber: 1) definición alternativa de derivada (no límite de la relación del cociente) como mapa lineal entre diferenciales (lo siento, no soy matemático) 2) definición de diferencial basado en el "producto interno" entre matrices (traza del producto frobenius)? Gracias
La respuesta a esta pregunta contiene una buena explicación de la derivada de Frechet, que es una generalización de la derivada ordinaria al cálculo multivariable.

"Todavía me pregunto si podría existir una regla de cadena razonable para derivadas que involucren matrices, porque esta solución no permite explotar la información que ya tengo sobre la derivada de la matriz".

Si tal cosa existe, entonces no lo sé. Sin embargo, al identificar R norte × norte con R norte 2 como en los comentarios, aún puede conservar la información que tiene sobre la matriz y su derivada.

Para ver esto, supongamos det ( R ) = 1 . Esto le da una relación entre las entradas de R ; en el caso bidimensional, si

R = ( a b C d ) ,
entonces
det ( R ) = 1 a d b C = 1.
por reescribir R como el vector ( a , b , C , d ) R 4 , todavía tienes una relación entre las variables, muy parecida a las coordenadas de un 2 -esfera S 2 son típicamente ( X , y , z ) R 3 con la relación X 2 + y 2 + z 2 = 1 .

Cuando calcula la derivada, las relaciones le permiten reescribir algunas derivadas en términos de otras, que es como explota su relación. Entonces, si cada entrada en R es una función de t , entonces

d R d t = R a d a d t + R b d b d t + R C d C d t + R d d d d t .
Pero a d b C = 1 implica que d = ( 1 + b C ) / a , entonces
d d d t = d a d a d t + d b d b d t + d C d C d t .
Admito que esto puede complicarse, pero trabajar en R norte 2 es análogo a trabajar en R norte × norte y aún puedes explotar sus relaciones de esta forma.

También me gustaría señalar que nunca antes había hecho esto, por lo que no afirmo que este sea el mejor método en absoluto. Es justo lo que yo haría.

Veo a que te refieres. Mi principal preocupación era la expresión de la matriz derivada, en lugar de la condición determinante, que, dicho sea de paso, es mucho más compleja como R S O ( 3 )