多変数関数の極値に対する一階必要条件
📂最適化理論多変数関数の極値に対する一階必要条件
定理
関数 f:Rn→Rが与えられたとしよう。もし x∗がローカルオプティマイザーlocal optimizerであり、x∗の近傍でf∈C1ならば、
∇f(x∗)=0
∇fは、fのグラディエントである。ここで、0は数値ゼロではなく、ゼロベクトルであることに注意。
説明
1次必要条件は、x∗がfのローカルミニマイザーである場合、fの1次導関数であるグラディエントが持つ性質について教えてくれる。名前がつけられ、多変数関数に拡張されているが、極大や極小で微分すると0になるというのは、学生時代にも学ぶ内容だ。
証明
背理法で証明する。∇f(x∗)=0と仮定しよう。そして以下のように記す。
p=−∇f(x∗),pt∇f(x∗)=−∥∇f(x∗)∥2<0
ここで、ptは転置行列を指す。すると、∇fが連続であるため、以下の式が成り立つs>0が存在する。
pt∇f(x∗+ξp)<0,∀ξ∈[0,s]
また、多変数関数のテイラー展開式によると、
f(x∗+ξp)=f(x∗)+ξpt∇f(x∗+ξˉp),for some ξˉ∈(0,ξ)
すると、(1)と(2)により次が得られる。
f(x∗+ξp)<f(x∗),∀ξ∈[0,s]
これは、x∗がローカルミニマイザーであるという事実に矛盾する。従って、仮定が間違っており、∇f(x∗)=0である。
■
参照