Derivada de una función dividida por su norma, es decir, ϕ(x)=f(x)∥f(x)∥ϕ(x)=f(x)‖f(x)‖\phi(x) = \frac{ f(x)}{\|f(x)\|}

Configuración

F : R norte R norte y ser la norma euclidiana usual. Me gustaría calcular la derivada con respecto a X de

ϕ ( X ) = F ( X ) F ( X )

Mi intento de solución

X F ( X ) | | F ( X ) | | = X F ( X ) | | F ( X ) | | + F ( X ) X ( F ( X ) F ( X ) ) 1 2 = X F ( X ) | | F ( X ) | | 1 2 F ( X ) | | F ( X ) | | 3 2 F ( X ) X F ( X ) = ( I F ( X ) F ( X ) | | F ( X ) | | 2 ) X F ( X ) | | F ( X ) | |
Sin embargo, estoy muy inseguro acerca de esto. En particular, tengo la sensación de que el segundo término sería F ( X ) X F ( X ) y por lo tanto conducir a
X F ( X ) | | F ( X ) | | = X F ( X ) | | F ( X ) | | X F ( X ) | | F ( X ) | | = 0
Sin embargo, esto no tendría mucho sentido porque seguramente el gradiente no es 0 para cada función.

¿Tiene alguna suposición sobre F ?
Estoy feliz de asumir lo que necesito para que esto funcione. Por ejemplo, feliz por gramo ser Lipschitz continuo y/o acotado. @NickCastillo
@NickCastillo Así que en la práctica gramo será la función de gradiente de otra función F : R norte R . También sé que la función hessiana H : R norte R norte × norte está bien definido (es decir, el Hessian H ( X ) = X gramo ( X ) existe)

Respuestas (3)

Separado F en dos componentes: su longitud ( λ ) y direccion ( ϕ )

λ 2 = F 2 λ d λ = F T d F ϕ = λ 1 F
Calcular el diferencial de ϕ
d ϕ = λ 1 d F λ 2 F d λ = λ 1 d F λ 3 F ( λ d λ ) = λ 1 I d F λ 3 F ( F T d F ) = λ 1 ( I ϕ ϕ T ) d F
Ahora diferencie con respecto a X
ϕ X = ( I ϕ ϕ T λ ) F X
Entonces su solución inicial fue absolutamente correcta. Y puedes probar el famoso resultado de que los vectores unitarios son perpendiculares a sus gradientes
ϕ T ( ϕ X ) = ( ϕ T ( 1 ) ϕ T λ ) F X = ( 0 λ ) F X = 0

Esta es una gran solución. Una cosa que me está molestando. Cómo λ d λ = F T d F ? En particular, ¿por qué " F T ".
@user550103, tienes λ 2 = λ λ = F 2 = F T F , entonces d ( λ λ ) = ( d λ ) λ + λ ( d λ ) = 2 λ d λ , lo mismo para d F T F = ( d F T ) F + F T d F = 2 F T d F , de vuelta a la igualdad: 2 λ d λ = 2 F T d F λ d λ = F T d F
@MathLearner Gracias. Efectivamente (esto es lo que pasa cuando quieres irte de vacaciones pronto...)

Como las apuestas por gradiente son bajas, calculemos la derivada total de ϕ como sigue:

d pag ϕ ( v ) = d pag F ( v ) F ( pag ) F ( pag ) 1 2 F ( pag ) 2 d pag F ( v ) , F ( pag F ( pag ) 2 = 1 F ( pag ) ( d pag F ( v ) F ( pag ) F ( pag ) F ( pag ) F ( pag ) , d pag F ( v ) , ) ,
que es un resultado bastante agradable ya que es la perpendicular de d pag F ( v ) a F ( pag ) , escalado por la longitud de F ( pag ) .

Presentaré el cálculo en coordenadas estándar. Su ϕ es la composicion de tu ( X ) = X / X y F ( X ) , es decir

ϕ i ( X ) = tu i ( F ( X ) ) , tu i ( X ) = X i X .
Para X lejos del origen, como tu i ( X ) = i X , y desde ( 1 / X ) = 1 / X 2 , producto y regla de la cadena da
k tu i = d i k X X i X k X 3 .
O, si lo prefieres, tu = 1 X I norte 1 X 3 X X T . Siempre y cuando F evita el origen, la regla de la cadena da
j ϕ i = k = 1 norte k tu i ( F ( X ) ) j F k ( X ) = j F i ( X ) F ( X ) 1 F ( X ) 3 k = 1 norte F i ( X ) F k ( X ) j F k
es decir, el jacobiano es
ϕ = F F 1 F 3 F F T F .


Con respecto a tu comentario final sobre el sentimiento: el error en tu intuición es que reemplazaste F F T R norte × norte con el escalar F T F = F 2 . De hecho, esto es (como básicamente dijiste) lo que hace que los dos términos sean diferentes. De hecho, esto ya es evidente a partir de la fórmula anterior para tu = i j X .

Como X "escalas" como una potencia de X , dos derivadas deberían "escalar" como X 1 2 = 1 / X . Que es precisamente lo que vemos, excepto en el caso de la dimensión norte = 1 donde la derivada es de hecho exactamente 0 donde sea que se defina (!!) En dimensiones más altas, simplemente hay más funciones que tienen la misma escala, lo que lleva a su error.