Saltar al contenido

Cómo interpretar el hessiano de una función

Nuestro equipo de trabajo ha estado mucho tiempo buscando soluciones a tus preguntas, te compartimos la soluciones así que nuestro objetivo es servirte de gran apoyo.

Solución:

Creo que la siguiente interpretación es útil. De la misma forma que el gradiente de una función de muchas variables es análogo a la primera derivada en una variable, entiendo que la hessiana es análoga a las segundas derivadas. Tomando un vector $v in mathbb R^n$ el gradiente de $f$ nos permite calcular la derivada direccional de $f$ en la dirección de $v$: $$f_v(x) = v^T nabla f(x).$$ De manera similar, la hessiana $Hf(x)$ nos permite calcular las segundas derivadas: vectores dados $u,vin mathbb R^n$: $$f_uv(x) = u^THf(x)v.$$ Por ejemplo, $f_uu =u^THf(x)u$ es la segunda derivada en la dirección de $u$.

Editar: u y v deben tomarse como vectores unitarios.

Esto es más un comentario a la respuesta de Brulboy que una respuesta en sí misma.

Si fija un punto $x$, por lo general puede $^[1]$ diagonalizar la matriz hessiana con una base ortonormal. Esto significa que puede tomar un sistema cartesiano de coordenadas ortogonales centrado en $x$ que hace que su matriz se vea así: $$Hf(x)equiv beginbmatrix lambda_1 & & &\ & lambda_2 & & & & ddots &\& & &lambda_nendbmatrix.$$ Esas $lambda$s son segundas derivadas de funciones de una sola variable. Específicamente, si restringes $f$ al eje de coordenadas $j$-ésimo (del sistema de coordenadas diagonalizante), obtienes una función de una variable cuya segunda derivada es exactamente $lambda_j$.

Por lo tanto, cuando observa una matriz hessiana en un punto y ve una confusión de números, simplemente no está eligiendo las mejores coordenadas para ese punto.


$^{[1]PS Por generalmente Quiero decir: incluso si alguien probara que, a veces, esto no se puede hacer, los ejemplos son algo patológicos y es poco probable que se manifiesten en la vida real. El asunto se discute a fondo aquí.

Por lo que he recopilado, dado que Hessian codifica las segundas derivadas de una función multivariante, su función principal es ayudar a determinar máximos y mínimos. También ayuda a escribir aproximaciones compactas de Taylor de segundo grado para funciones. Quizás haya más, pero esto es lo que acabo de aprender sobre el Hessian.

Te mostramos reseñas y valoraciones

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *