La norma nuclear se define de la siguiente manera
y, de Derivado de la norma nuclear con respecto a su argumentación ,
¿ Cuál es la segunda derivada de la norma nuclear?
Lo necesito para calcular el método de Newton para mi algoritmo y no he tenido mucho éxito. Cualquier ayuda sería muy apreciada. ¡Gracias de antemano!
La razón por la que no ha tenido éxito es que la norma nuclear no es diferenciable. Tu respuesta para la derivada es solo parcialmente correcta. Si estás en el cono definido positivo, tu respuesta es correcta y se reduce a la matriz identidad. , pero si la matriz es de rango bajo, entonces la función no es diferenciable y lo mejor que puede hacer es calcular el subdiferencial
Dado que la norma nuclear es una norma y todas las normas son convexas, podemos hablar de la subdiferencial, que es el conjunto de todas las tangentes que se encuentran debajo de la función. La prueba del resultado anterior se puede encontrar en este documento:
Watson, GA Caracterización del subdiferencial de algunas normas matriciales. Álgebra lineal y sus aplicaciones, 170:33–45, 1992.
De la expresión anterior puedes ver que la norma nuclear es lineal por partes en cada uno de los conos. Por lo tanto, la segunda derivada sería cero en cada una de las piezas diferenciables. Eso debería explicar por qué el algoritmo de Newton no funciona tan bien (en realidad, depende de qué más haya en su función objetivo). Otra forma de verlo es que todas las normas se ven como cuando tomas rebanadas unidimensionales, y es lineal por tramos con la segunda derivada 0 excepto en donde no es diferenciable.
Si realmente quiere usar el enfoque de Newton, debe usar la formulación variacional que dice que
Asumir que . Dejar ; entonces es en un barrio de cualquier que tiene rango completo .
Dejar ; entonces .
Según mi publicación o la de greg en (1)
Derivado de la norma nuclear con respecto a su argumentación
el derivado de es .
Desafortunadamente, no existe tal forma cerrada para , porque, en general, y no conmutar (eso es inútil para el cálculo de la primera derivada).
Por otro lado, eso de arriba no funciona cuando no tiene rango completo. Dado que las normas son todas equivalentes, no entiendo por qué los investigadores persisten en usar la norma nuclear en lugar de la norma estándar de Frobenius. Se me escapa algo pero los especialistas seguro que tienen buenas razones.
Acerca de los métodos alternativos, Peder dio aquí una respuesta interesante sobre el subdiferencial. Además, Michael Grant en (1) nuevamente habla sobre varios métodos que parecen dar una buena respuesta a la pregunta del OP; por último, pero no menos importante, Michael da un enlace a su software TFOCS
Finalmente, los especialistas se cansan de responder preguntas muchas veces sin ser realmente escuchados; de hecho, la gente prefiere reinventar la rueda...
Ben Grossman
greg