인 함수 에 대한 이차미분을 모아놓은 행렬

정의

  • (스칼라를 출력하는 함수에 대하여)

다른 표현

  • 헤세 행렬은 기울기의 야코비 행렬이다.

  • 기울기(Gradient): 각 변수에 대한 일차 편미분을 벡터로 모은 것

  • 기울기의 야코비 행렬

    • 기울기 자체가 벡터이므로, 기울기를 각 변수에 대해 다시 편미분하면 결과적으로 야코비 행렬을 얻을 수 있다.
    • 즉, 기울기의 각 성분을 한 번 더 미분하면 이차 미분 정보가 모인 헤세 행렬이 된다.
  • 헤세 행렬의 정의

    • 스칼라 함수  의 헤세 행렬은 각 변수에 대해 이차 편미분을 수행한 결과를 정리한 행렬이다.
    • 기울기의 각 성분에 대해 한 번 더 편미분한 것이므로, 실제로는 기울기 벡터에 대한 야코비 행렬과 같다.

특징

  • 헤세 행렬은 대칭행렬이다.
    • 이차 편미분이 연속인 모든 점에서는 미분 연산자가 “가환적”이다.
  • 해세 행렬의 값이 실수값, 대칭행렬인 경우 해세 행렬을 실수 고윳값들의 집합과 고유벡터들로 이루어진 직교 기저로 분해할 수 있다.

활용

  • 헤세 행렬은 다변수 함수의 곡률(즉, 변화율의 변화)을 나타내기 때문에 최적화 문제에서 중요함
  • 함수의 최소값이나 최대값을 찾을 때 헤세 행렬의 양의 정부호 여부(즉, 모든 고유값이 양수인지)를 통해 함수가 볼록(convex)한지 비볼록(non-convex)한지 확인할 수 있음
  • 양의 곡률인 경우 기울기로 예측한 것보다 느리게 비용함수가 감소한다.
  • 음의 곡률이라면 기울기로 예측한 것보다 빠르게 비용함수가 감소한다.