Cómo encontrar el límite superior e inferior

Dejar Σ S + + norte sea ​​una matriz definida positiva simétrica con todas las entradas diagonales una. Dejar tu R norte × k 1 , W R norte × k 2 , Λ R k 1 × k 1 y T R k 2 × k 2 , dónde Λ y T son ambas matrices diagonales con elementos positivos, y norte > k 2 > k 1 . también sabemos rastro ( Λ ) = m × rastro ( T ) y suma de valores absolutos de todos los elementos de tu es menos que W . Entonces, ¿cómo puedo encontrar el límite superior e inferior en-

Σ tu T tu F 2 Σ W Λ W F 2

en términos de m , W , Λ y Σ . Asumir que Σ F 2 tu T tu F 2 y Σ F 2 W Λ W F 2

Respuestas (2)

Así que buscaremos los extremos de la función.

F ( m , W , Λ , Σ ) = Σ tu T tu F 2 Σ W Λ W F 2

Observamos que el denominador está completamente definido por los parámetros de la función, por lo que para fines de optimización es solo una constante, llamémoslo k . Además, podemos insertar explícitamente que T es diagonal, es decir T i j = t i d i j . Podemos escribir un problema de optimización de la siguiente manera: Maximizar o minimizar la norma L2 de alguna diferencia

F ( m , W , Λ , Σ ) = 1 k i j ( Σ i j k t k tu i k tu k j ) 2 máximo o r min

sujeto a restricciones:

i t i = 1 m i Λ i i = α

y

| tu | 1 < | W | 1 = β

dónde α y β son constantes conocidas.

Este problema es efectivamente una regularización de Lasso con una restricción de igualdad adicional. AFAIK, los problemas de regularización de este tipo generalmente se resuelven numéricamente, lo que significa que no hay soluciones analíticas explícitas disponibles.

Estoy buscando un límite superior e inferior que se pueda encontrar analíticamente, y los límites deben ser muy estrictos.
@DushyantSahoo Ya veo. Lo siento, entendí mal la pregunta. Asumí erróneamente que el objetivo era encontrar el valor máximo y mínimo, que es mucho más estricto que un límite superior o inferior.
No se preocupe, escribí una solución, pero no estoy seguro de qué tan correcta es.

Primero encontramos un límite superior en tu T tu F 2 en términos de W y Λ -

tu T tu F 2 tu F 4 T F 2 1 m W F 4 Λ F 2

Ahora, suponiendo que Σ F 2 tu T tu F 2 y Σ F 2 W Λ W F 2

Σ F 2 tu T tu F 2 Σ tu T tu F 2 Σ F 2 + tu T tu F 2 Σ F 2 1 m W F 4 Λ F 2 Σ tu T tu F 2 Σ F 2 + 1 m W F 4 Λ F 2 Σ F 2 1 m W F 4 Λ F 2 Σ W Λ W F 2 Σ tu T tu F 2 Σ W Λ W F 2 Σ F 2 + 1 m W F 4 Λ F 2 Σ W Λ W F 2 Σ F 2 1 m W F 4 Λ F 2 Σ F 2 + W Λ W F 2 Σ tu T tu F 2 Σ W Λ W F 2 Σ F 2 + 1 m W F 4 Λ F 2 Σ F 2 W Λ W F 2
Asumir que C Σ F 2 = W Λ W F 2 dónde 0 C 1 , obtenemos

Σ F 2 1 m W F 4 Λ F 2 ( 1 + C ) Σ F 2 Σ tu T tu F 2 Σ W Λ W F 2 Σ F 2 + 1 m W F 4 Λ F 2 ( 1 C ) Σ F 2
Como W , Λ y Σ son fijos, vamos W F 4 Λ F 2 Σ F 2 = t , entonces nosotros tenemos
1 t m ( 1 + C ) Σ tu T tu F 2 Σ W Λ W F 2 1 + t m ( 1 C )