¿Cómo obtener el gradiente de un producto de matriz con respecto a un vector?

Soy nuevo en el cálculo vectorial y aunque pude entender cómo derivar funciones más simples como el producto de dos vectores en R metro , estoy confundido acerca de este escenario específico.

Digamos que tenemos un vector columna X R metro , A R metro × metro .

¿Cómo puedo determinar el gradiente de X T A con respecto a X ?

No puedo comprender cómo se deriva algo con respecto a un vector.

Por lo que puedo ver X T A es igual a [ A 1 X , A 2 X , ..., A metro X ] para todas las columnas de A . Lo que significa que la operación produce un vector fila en R metro .

Traté de derivar esta solución con respecto a los escalares individuales de X pero estoy perdido ya que claramente no lo estoy abordando correctamente.

¿Cómo se solucionaría esto?

¿Todas las derivadas parciales de todos los componentes de la función vectorial que acabas de definir, no?
Además, busque jacobiano, como generalización de gradiente.

Respuestas (1)

Si miras ahora X T A como un mapa lineal R metro R metro como

F ( X 1 , , X metro ) = ( i = 1 metro a i 1 X i , , i = 1 metro a i metro X i )
para que no tengamos que pensar en F en columnas y filas o matrices, sabemos que el gradiente del mapa lineal se escribe como
F X = ( a 11 a 21 a metro 1 a 12 a 22 a metro 2 a 1 metro a 2 metro a metro metro ) = A T
por convención de derivadas son de izquierda a derecha y F -elementos de arriba hacia abajo.