logo

多変数関数の極値に対する一階必要条件 📂最適化理論

多変数関数の極値に対する一階必要条件

定理1

関数 f:RnRf : \mathbb{R}^{n} \to \mathbb{R}が与えられたとしよう。もし xx^{\ast}ローカルオプティマイザーlocal optimizerであり、xx^{\ast}近傍fC1f \in C^{1}ならば、

f(x)=0 \nabla f(x^{\ast}) = 0

f\nabla fは、ffグラディエントである。ここで、00は数値ゼロではなく、ゼロベクトルであることに注意。

説明

1次必要条件は、xx^{\ast}ffのローカルミニマイザーである場合、ffの1次導関数であるグラディエントが持つ性質について教えてくれる。名前がつけられ、多変数関数に拡張されているが、極大や極小で微分すると00になるというのは、学生時代にも学ぶ内容だ。

証明

背理法で証明する。f(x)0\nabla f (x^{\ast}) \ne 0と仮定しよう。そして以下のように記す。

p=f(x),ptf(x)=f(x)2<0 p = - \nabla f (x^{\ast}),\quad p^{t}\nabla f (x^{\ast}) = - \left\| \nabla f (x^{\ast}) \right\|^{2} \lt 0

ここで、ptp^{t}転置行列を指す。すると、f\nabla fが連続であるため、以下の式が成り立つs>0s \gt 0が存在する。

ptf(x+ξp)<0,ξ[0,s] \begin{equation} p^{t}\nabla f (x^{\ast} + \xi p) \lt 0, \qquad \forall \xi \in [0, s] \end{equation}

また、多変数関数のテイラー展開式によると、

f(x+ξp)=f(x)+ξptf(x+ξˉp),for some ξˉ(0,ξ) \begin{equation} f(x^{\ast} + \xi p) = f (x^{\ast}) + \xi p^{t} \nabla f(x^{\ast} + \bar{\xi} p),\quad \text{for some } \bar{\xi} \in (0, \xi) \end{equation}

すると、(1)(1)(2)(2)により次が得られる。

f(x+ξp)<f(x),ξ[0,s] f(x^{\ast} + \xi p) \lt f (x^{\ast}), \qquad \forall \xi \in [0, s]

これは、xx^{\ast}がローカルミニマイザーであるという事実に矛盾する。従って、仮定が間違っており、f(x)=0\nabla f (x^{\ast}) = 0である。

参照


  1. J. Nocedal and Stephen J. Wright, Numerical Optimization (2nd), p14-15 ↩︎