Derivada de la entropía de von Neumann

Preguntas relacionadas aquí y aquí

Estoy tratando de calcular la derivada de S ( X ) = T r ( X registro ( X ) ) . Una condición adicional es que X = L T L para algunos L y quiero sacar la derivada con respecto a L . Básicamente, me gustaría encontrar

T r ( L T L registro ( L T L ) ) L
Esto está bien definido ya que es la derivada de una función escalar con respecto a una matriz por lo que debería obtener una matriz de tamaño L .

Mi progreso hasta ahora:

Usa la regla del producto para dividirlo en dos derivadas. Así que tengo T r ( L T L C ) L , dónde C = registro ( L T L ) pero se trata como una constante. De acuerdo con el libro de cocina matriz, obtengo L ( C T + C ) = L ( registro ( L T L ) ) T + L registro ( L T L ) .

El otro término, T r ( C registro ( L T L ) ) L , es más problemático. pensé en dejar L T L = X y uso la regla de la cadena, pero no estoy seguro de cómo lidiar con el X L término ya que ahora tengo la derivada de una matriz con respecto a una matriz (en lugar de escalar con matriz).

Así que la pregunta, después de mi trabajo, ahora es cómo sacar la derivada del segundo término. Alternativamente, si la regla del producto fue una mala idea y puedo hacerlo de manera más directa, eso también sería muy útil. Gracias.

Respuestas (1)

Considere la siguiente función escalar y su derivada.

F ( X ) = X registro ( X ) F ( X ) = 1 + registro ( X )
Cuando la función se aplica a un argumento de matriz, el resultado es una matriz
F = F ( X )
El diferencial de la traza de F es entonces
d T r ( F ) = F ( X ) T : d X = ( I + registro ( X ) ) T : d X
Ahora suponga que X se describe en términos de otra matriz L , es decir
X = L T L d X = L T d L + d L T L
Sustituyendo esto en el resultado anterior se obtiene
d T r ( F ) = ( I + registro ( L T L ) ) T : ( L T d L + d L T L ) = 2 ( I + registro ( L T L ) ) : L T d L = 2 L ( I + registro ( L T L ) ) : d L T r ( F ) L = 2 ( L + L registro ( L T L ) )
NB: En algunos pasos anteriores, se utilizan dos puntos como notación de producto para la traza, es decir
A : B = T r ( A T B )

¡Gran respuesta! Solo una pregunta: ¿Cómo pasaste de ( I + registro ( L T L ) ) T : ( L T d L + d L T L ) a 2 ( I + registro ( L T L ) ) : ( L T d L ) ? Gracias
De estas afirmaciones fácilmente demostrables se sigue
( L T d L ) T = ( L T d L ) ( registro ( L T L ) + I ) T = ( registro ( L T L ) + I ) A T : B = A : B T
¡Ups! Se deduce de estas declaraciones fácilmente probadas (corrigiendo mi comentario anterior)
( L T d L ) T = ( d L T L ) ( registro ( L T L ) + I ) T = ( registro ( L T L ) + I ) A T : B = A : B T