다변수함수의 극값에 대한 2계 필요/충분 조건
📂최적화이론다변수함수의 극값에 대한 2계 필요/충분 조건
정리
함수 f:Rn→R가 주어졌다고 하자. ∇f, ∇2f를 각각 f의 그래디언트와 헤시안이라고 하자.
2계 필요 조건second-order necessary conditions
만약 x∗가 지역 최적해local optimizer이고, x∗의 근방에서 ∇2f가 존재하고 연속이면,
∇f(x∗)=0
이고 ∇2f(x∗)는 양의 준정부호이다.
여기서 0은 숫자 영zero이 아니라, 영벡터임에 주의하라.
2계 충분 조건second-order sufficient conditions
x∗의 근방에서 ∇2f가 연속이고, ∇f(x∗)=0, 그리고 ∇f(x∗)가 양의 정부호라고 하자. 그러면 x∗는 엄격한 지역 최적해이다.
설명
필요조건은 x∗가 극값일 때 f가 가지는 성질에 대해 얘기한다. 충분조건은 f가 어떤 성질을 가질 때 x∗가 극값인지에 대해서 얘기한다.
증명
2계필요조건
1계필요조건에 의해 ∇f(x∗)가 성립하는 것은 사실이다.
나머지 내용은 귀류법으로 증명한다. ∇2f(x∗)가 양의 준정부호가 아니라고 가정하자. 그리고 pt∇2f(x∗)p<0을 만족하는 어떤 벡터 p를 선택하자. 이때 pt는 전치행렬이다. 그러면 ∇2f가 x∗ 근방에서 연속이므로, 어떤 s>0에 대해서 다음이 성립한다.
pt∇2f(x∗+ξp)p<0,∀ξ∈[0,s]
또한 다변수함수의 테일러전개공식에 의해,
f(x∗+ξp)=f(x∗)+ξpt∇f(x∗)+21ξ2pt∇2f(x∗+ξˉp)p,for some ξˉ∈(0,ξ)
그러면, ∇f(x∗)=0이므로, (1)과 (2)에 의해 다음을 얻는다.
f(x∗+ξp)<f(x∗),∀ξ∈[0,s]
이는 x∗가 로컬 미니마이저라는 사실에 모순된다. 따라서 가정이 틀렸으며, ∇2f(x∗)는 양의 준정부호 행렬이다.
■
2계충분조건
x∗에서 헤시안 ∇2f가 연속이고 양의 정부호이므로, 모든 x∈B에 대해서 ∇2f(x)가 양의 정부호가 되도록하는 오븐 볼 Br={x:∥x−x∗∥<r}을 선택할 수 있다.
pt∇2f(x)p>0,∀p∈Rn
이제 0이 아니고 ∥p∥<r인 어떤 벡터 p에 대해서, 다변수함수의 테일러전개공식에 의해, 다음을 얻는다.
f(x∗+p)=f(x∗)+pt∇f(x∗)+21pt∇2f(x+ξp)p,ξ∈(0,1)=f(x∗)+21pt∇2f(x+ξp)p
여기서 x∗+ξp∈B이므로,
f(x∗+p)>f(x∗)
따라서 x∗는 로컬 미니마이저이다.
■
같이보기