logo

다변수함수의 극값에 대한 2계 필요/충분 조건 📂최적화이론

다변수함수의 극값에 대한 2계 필요/충분 조건

정리1

함수 f:RnRf : \mathbb{R}^{n} \to \mathbb{R}가 주어졌다고 하자. f\nabla f, 2f\nabla^{2}f를 각각 ff그래디언트헤시안이라고 하자.

  • 2계 필요 조건second-order necessary conditions

    만약 xx^{\ast}지역 최적해local optimizer이고, xx^{\ast}근방에서 2f\nabla^{2}f가 존재하고 연속이면,

    f(x)=0 \nabla f(x^{\ast}) = 0

    이고 2f(x)\nabla^{2} f(x^{\ast})양의 준정부호이다.

    여기서 00은 숫자 영zero이 아니라, 영벡터임에 주의하라.

  • 2계 충분 조건second-order sufficient conditions

    xx^{\ast}의 근방에서 2f\nabla^{2}f가 연속이고, f(x)=0\nabla f (x^{\ast}) = 0, 그리고 f(x)\nabla f(x^{\ast})가 양의 정부호라고 하자. 그러면 xx^{\ast}엄격한 지역 최적해이다.

설명

필요조건은 xx^{\ast}가 극값일 때 ff가 가지는 성질에 대해 얘기한다. 충분조건은 ff가 어떤 성질을 가질 때 xx^{\ast}가 극값인지에 대해서 얘기한다.

증명

2계필요조건

1계필요조건에 의해 f(x)\nabla f(x^{\ast})가 성립하는 것은 사실이다.

나머지 내용은 귀류법으로 증명한다. 2f(x)\nabla^{2} f(x^{\ast})가 양의 준정부호가 아니라고 가정하자. 그리고 pt2f(x)p<0p^{t} \nabla^{2}f(x^{\ast}) p \lt 0을 만족하는 어떤 벡터 pp를 선택하자. 이때 ptp^{t}전치행렬이다. 그러면 2f\nabla^{2}fxx^{\ast} 근방에서 연속이므로, 어떤 s>0s \gt 0에 대해서 다음이 성립한다.

pt2f(x+ξp)p<0,ξ[0,s] \begin{equation} p^{t} \nabla^{2}f(x^{\ast} + \xi p) p \lt 0,\quad \forall \xi \in [0, s] \end{equation}

또한 다변수함수의 테일러전개공식에 의해,

f(x+ξp)=f(x)+ξptf(x)+12ξ2pt2f(x+ξˉp)p,for some ξˉ(0,ξ) \begin{equation} f(x^{\ast} + \xi p) = f (x^{\ast}) + \xi p^{t} \nabla f(x^{\ast}) + \dfrac{1}{2}\xi^{2} p^{t} \nabla^{2} f(x^{\ast} + \bar{\xi} p)p,\quad \text{for some } \bar{\xi} \in (0, \xi) \end{equation}

그러면, f(x)=0\nabla f(x^{\ast}) = 0이므로, (1)(1)(2)(2)에 의해 다음을 얻는다.

f(x+ξp)<f(x),ξ[0,s] f(x^{\ast} + \xi p) \lt f (x^{\ast}), \qquad \forall \xi \in [0, s]

이는 xx^{\ast}가 로컬 미니마이저라는 사실에 모순된다. 따라서 가정이 틀렸으며, 2f(x)\nabla^{2} f (x^{\ast})는 양의 준정부호 행렬이다.

2계충분조건

xx^{\ast}에서 헤시안 2f\nabla^{2}f가 연속이고 양의 정부호이므로, 모든 xBx \in B에 대해서 2f(x)\nabla^{2}f (x)가 양의 정부호가 되도록하는 오븐 볼 Br={x:xx<r}B_{r} = \left\{ x : \left\| x - x^{\ast} \right\| \lt r \right\}을 선택할 수 있다.

pt2f(x)p>0,pRn p^{t}\nabla^{2} f(x) p \gt 0,\quad \forall p \in \mathbb{R}^{n}

이제 00이 아니고 p<r\left\| p \right\| \lt r인 어떤 벡터 pp에 대해서, 다변수함수의 테일러전개공식에 의해, 다음을 얻는다.

f(x+p)=f(x)+ptf(x)+12pt2f(x+ξp)p,ξ(0,1)=f(x)+12pt2f(x+ξp)p \begin{align*} f(x^{\ast} + p) &= f(x^{\ast}) + p^{t}\nabla f(x^{\ast}) + \dfrac{1}{2}p^{t} \nabla^{2} f(x + \xi p) p,\quad \xi \in (0, 1) \\ &= f(x^{\ast}) + \dfrac{1}{2}p^{t} \nabla^{2} f(x + \xi p) p \end{align*}

여기서 x+ξpBx^{\ast} + \xi p \in B이므로,

f(x+p)>f(x) f(x^{\ast} + p) \gt f(x^{\ast})

따라서 xx^{\ast}는 로컬 미니마이저이다.

같이보기


  1. J. Nocedal and Stephen J. Wright, Numerical Optimization (2nd), p14-15 ↩︎