logo

多変数関数の極値に対する2階の必要/十分条件 📂最適化理論

多変数関数の極値に対する2階の必要/十分条件

要旨1

関数 f:RnRf : \mathbb{R}^{n} \to \mathbb{R} が与えられたとしよう。f\nabla f, 2f\nabla^{2}f をそれぞれ ff勾配ヘシアンとする。

  • 2次必要条件

    xx^{\ast}局所最適解であり、xx^{\ast}近傍2f\nabla^{2}f が存在し、連続であれば、

    f(x)=0 \nabla f(x^{\ast}) = 0

    であり、2f(x)\nabla^{2} f(x^{\ast})半正定行列である。

    ここで 00 は数値のゼロではなく、ゼロベクトルであることに注意。

  • 2次十分条件

    xx^{\ast} の近傍で 2f\nabla^{2}f が連続であり、f(x)=0\nabla f (x^{\ast}) = 0、そして f(x)\nabla f(x^{\ast}) が正定であるとする。すると xx^{\ast}厳密な 局所最適解である。

解説

必要条件は xx^{\ast} が極値であるときの ff が持つ性質について述べる。十分条件は ff がある性質を持つときに xx^{\ast} が極値であるかどうかについて述べる。

証明

2次必要条件

1次必要条件により f(x)\nabla f(x^{\ast}) が成立するのは事実だ。

残りは背理法で証明する。2f(x)\nabla^{2} f(x^{\ast}) が半正定でないと仮定する。そして pt2f(x)p<0p^{t} \nabla^{2}f(x^{\ast}) p \lt 0 を満たすあるベクトル pp を選ぶ。ここで ptp^{t}転置行列である。したがって、2f\nabla^{2}fxx^{\ast} の近傍で連続であるため、ある s>0s \gt 0 について次が成立する。

pt2f(x+ξp)p<0,ξ[0,s] \begin{equation} p^{t} \nabla^{2}f(x^{\ast} + \xi p) p \lt 0,\quad \forall \xi \in [0, s] \end{equation}

また、多変数関数のテイラー展開公式により、

f(x+ξp)=f(x)+ξptf(x)+12ξ2pt2f(x+ξˉp)p,for some ξˉ(0,ξ) \begin{equation} f(x^{\ast} + \xi p) = f (x^{\ast}) + \xi p^{t} \nabla f(x^{\ast}) + \dfrac{1}{2}\xi^{2} p^{t} \nabla^{2} f(x^{\ast} + \bar{\xi} p)p,\quad \text{for some } \bar{\xi} \in (0, \xi) \end{equation}

すると、f(x)=0\nabla f(x^{\ast}) = 0 であり、(1)(1)(2)(2) により次を得る。

f(x+ξp)<f(x),ξ[0,s] f(x^{\ast} + \xi p) \lt f (x^{\ast}), \qquad \forall \xi \in [0, s]

これは xx^{\ast} が局所最小値である事実に矛盾する。したがって、仮定が間違っており、2f(x)\nabla^{2} f (x^{\ast}) は半正定行列である。

2次十分条件

xx^{\ast} でのヘシアン 2f\nabla^{2}f が連続で正定であるため、すべての xBx \in B に対して 2f(x)\nabla^{2}f (x) が正定となるような開球 Br={x:xx<r}B_{r} = \left\{ x : \left\| x - x^{\ast} \right\| \lt r \right\} を選べる。

pt2f(x)p>0,pRn p^{t}\nabla^{2} f(x) p \gt 0,\quad \forall p \in \mathbb{R}^{n}

今、00 ではなく p<r\left\| p \right\| \lt r を満たすあるベクトル pp について、多変数関数のテイラー展開公式により、次を得る。

f(x+p)=f(x)+ptf(x)+12pt2f(x+ξp)p,ξ(0,1)=f(x)+12pt2f(x+ξp)p \begin{align*} f(x^{\ast} + p) &= f(x^{\ast}) + p^{t}\nabla f(x^{\ast}) + \dfrac{1}{2}p^{t} \nabla^{2} f(x + \xi p) p,\quad \xi \in (0, 1) \\ &= f(x^{\ast}) + \dfrac{1}{2}p^{t} \nabla^{2} f(x + \xi p) p \end{align*}

ここで、x+ξpBx^{\ast} + \xi p \in B であるため、

f(x+p)>f(x) f(x^{\ast} + p) \gt f(x^{\ast})

したがって、xx^{\ast} は局所最小値である。

参照


  1. J. Nocedal and Stephen J. Wright, Numerical Optimization (2nd), p14-15 ↩︎