Los multiplicadores de Lagrange no dan todas las soluciones

Estaba trabajando en un problema de maximización que se puede reducir a maximizar

F ( a , b , C , d ) = a b + b C + C d
sujeto a la restricción
a + b + C + d = 63
Pensé que este era un problema trivial y directo para el método del multiplicador de Lagrange, así que definí el Lagrangiano como
L ( a , b , C , d , λ ) = a b + b C + C d λ ( a + b + C + d 63 )
y al igualar las derivadas a 0, obtuve
b λ = 0 a + C λ = 0 b + d λ = 0 C λ = 0 a + b + C + d = 63
Ese es un problema lineal que se puede reformular como encontrar la solución para el sistema. A X = b con
A = [ 0 1 0 0 1 1 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 1 1 1 0 ]
y
b = [ 0 0 0 0 63 ] T
para mi sorpresa, este sistema se determina con una sola solución para a , b , C y d
X = [ 0 31.5 31.5 0 ] T
Pero una evaluación directa de la función a maximizar y las restricciones muestra que, por ejemplo, el vector
X = [ 31.5 31.5 0 0 ] T
produce el mismo resultado para la función y también es parte de la superficie de restricción, por lo que también debería ser un punto crítico, además, hay infinidad de puntos críticos, entonces, ¿de qué manera los multiplicadores de Lagrange solo me dan un resultado?

¿De dónde viene este problema de maximización? O el maestro te tendió una trampa o la naturaleza del problema de optimización está en duda y no hay puntos óptimos.
No es que importe aquí, pero en general deberías poner un multiplicador adicional en la función objetivo. Si la función de restricción tiene un gradiente que desaparece en el conjunto restringido, esos puntos también serán críticos, vea caso anormal .
Una alternativa que se me ocurrió es que se te olvidó decirnos que a , b , C , d se supone que todos son no negativos. Estas restricciones adicionales convierten el conjunto de valores posibles de ( a , b , C , d ) en un conjunto compacto k (un 3-simplex), lo que implica que existen máximos y mínimos. En ese caso, la falta de extremos locales significa que los extremos están en el límite de k , y necesita estudiar varios problemas con dos restricciones (o eliminar una variable como en mi respuesta y luego estudiar los valores en el límite).
Esta fue en realidad una trivia geométrica que un amigo me mostró, donde los valores no solo deben ser no negativos sino también enteros. Simplemente abordé el problema con esto para ver rápidamente qué podía obtener (y, de hecho, por suerte, señalarme la dirección correcta)

Respuestas (1)

Sólo hay un punto crítico pero es indefinido. Esto se ve por ejemplo eliminando d y estudiando la arpillera del problema sin restricciones resultante (consulte los detalles a continuación). Por lo tanto no hay extremos locales.

Su función es ilimitada. Por ejemplo, si establecemos C = 0 , entonces la restricción se satisface por d = 63 a b , pero esto no afectará el valor de F . Echar un vistazo:

F ( a , b , 0 , 63 a b ) = a b .
Claramente, podemos hacer esto tan grande o tan pequeño como deseemos, y no hay un máximo o mínimo global.


En mi humilde opinión, por lo general es más fácil usar una restricción lineal simplemente para eliminar una de las variables. Si aquí resolvemos d = 63 a b C de la restricción, obtenemos la función en tres variables

gramo ( a , b , C ) = F ( a , b , C , 63 a b C ) = a b a C C 2 + 63 C .
Su gradiente es
gramo ( a , b , C ) = ( b C , a , 63 a 2 C ) ,
y esto se desvanece sólo en el punto crítico PAG 1 = ( a , b , C ) = ( 0 , 63 / 2 , 63 / 2 ) . La arpillera de gramo en PAG 1 es
H ( gramo , PAG 1 ) = ( 0 1 1 1 0 0 1 0 2 ) .
Su polinomio característico es
x H ( X ) = det ( X I 3 H ) = X 3 + 2 X 2 2 X 2.
Podríamos resolver los ceros usando Cardano, pero para nuestros propósitos es suficiente comprobar que x H ( X ) tiene ceros en los intervalos λ 1 ( 3 , 2 ) , λ 2 ( 1 , 0 ) , λ 3 = ( 1 , 2 ) . Ambos signos ocurren, por lo que la forma hessiana es indefinida. En otras palabras, PAG 1 es un punto de silla. Puede usar el criterio de Sylvester para llegar a la misma conclusión: PAG 1 no es un extremo local.

Debido a que la función objetivo es una forma cuadrática, esta pregunta probablemente se pueda resolver solo con álgebra lineal.
Esto tiene mucho sentido. Lo único que me queda es una intuición geométrica. En dos dimensiones, si un punto es crítico, todos los puntos de su entorno van "arriba", "abajo" o ambos (silla de montar). En ese caso esto no podría suceder ¿verdad? Los otros puntos que comparten el mismo valor de salida de la función que el punto crítico encontrado también deberían ser puntos críticos si me lo estoy imaginando bien.
No estoy de acuerdo con tu último punto @diegobatt. ¿Seguramente alrededor de un punto de silla se alcanza el mismo valor en puntos no críticos también?
me estaba confundiendo No importa