logo

偏導関数:多変数ベクトル関数の導関数 📂多変数ベクトル解析

偏導関数:多変数ベクトル関数の導関数

ビルドアップ1

一変数関数の導関数の定義を思い出そう。

limh0f(x+h)f(x)h=f(x) \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = f^{\prime}(x)

左辺の分子をhhに対する線形関数で近似すると、次のようになる。

f(x+h)f(x)=ah+r(h) \begin{equation} f(x+h) - f(x) = a h + r(h) \label{1} \end{equation}

ここで、r(h)r(h)を以下の条件を満たす残余remainder, 残差としよう。

limh0r(h)h=0 \lim \limits_{h \to 0} \dfrac{r(h)}{h}=0

すると、(1)\eqref{1}の両辺をhhで割り、limh0\lim_{h\to 0}である極限を取ると、次のようになる。

limh0f(x+h)f(x)h=limh0ah+r(h)h=a+limh0r(h)h=a \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = \lim \limits_{h\to 0} \dfrac{ah+ r(h)}{h} = a + \lim \limits_{h\to 0} \dfrac{r(h)}{h} = a

この時、aahhに対する線形近似での1次項の係数であった。このセンスで、aaffxxでの微分**‘係数’**と呼ぶことにする。式を少し変形すると、ffxxでの微分係数は、aaを満たす式であることがわかる。

limh0f(x+h)f(x)ahh=limh0r(h)h=0 \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x) - ah}{h} = \lim \limits_{h\to 0} \dfrac{r(h)}{h} = 0

これを基に多変数ベクトル関数の導関数を定義する。

定義

ERnE\subset \mathbb{R}^{n}開集合xE\mathbf{x}\in Eとする。f:ERm\mathbf{f} : E \to \mathbb{R}^{m}に対して、次を満たすhRn\mathbf{h} \in \mathbb{R}^{n}に対する線形変換 AL(Rn,Rm)A\in L(\mathbb{R}^{n}, \mathbb{R}^{m})が存在する場合、ffx\mathbf{x}で微分可能とされる。また、AAff全導関数total derivativeまたは単に導関数といい、f(x)\mathbf{f}^{\prime}(\mathbf{x})で表記する。

limh0f(x+h)f(x)A(h)h=0 \begin{equation} \lim \limits_{|\mathbf{h}| \to 0} \dfrac{| \mathbf{f} ( \mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) - A( \mathbf{h} )|}{|\mathbf{h}|} = 0 \label{2} \end{equation}

もしf\mathbf{f}EEのすべての点で微分可能であれば、f\mathbf{f}EEで微分可能であるとされる。

説明

は全体を意味し、偏導関数に対する言葉だ。全ˇ\check{}関数ではなく、全ˇ\check{}導関数である。

注意すべき点は、f(x)\mathbf{f}^{\prime}(\mathbf{x})は関数値ではなく、f(x):ERnRm\mathbf{f}^{\prime}(\mathbf{x}) : E \subset \R^{n} \to \R^{m}を満たす線形変換であることだ。したがって、f(x)=A\mathbf{f}^{\prime}(\mathbf{x}) = Aは次のように行列で表現できる。

f(x)=A=[a11a12a1na21a22a2nam1am2amn] \mathbf{f}^{\prime}(\mathbf{x}) = A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}

すると、f\mathbf{f}の全導関数f\mathbf{f}^{\prime}は、xERn\mathbf{x} \in E \subset \R^{n}が与えられるたびにあるm×nm \times n行列AAをマッピングする関数と見なすことができる。この行列はf\mathbf{f}偏導関数から簡単に得ることができ、ヤコビ行列Jacobian matrix, ヤコビ行列とも呼ばれる。

f(x)=[(D1f1)(x)(D2f1)(x)(Dnf1)(x)(D1f2)(x)(D2f2)(x)(Dnf2)(x)(D1fm)(x)(D2fm)(x)(Dnfm)(x)] \mathbf{f}^{\prime}(\mathbf{x}) = \begin{bmatrix} (D_{1}f_{1}) (\mathbf{x}) & (D_{2}f_{1}) (\mathbf{x}) & \cdots & (D_{n}f_{1}) (\mathbf{x}) \\ (D_{1}f_{2}) (\mathbf{x}) & (D_{2}f_{2}) (\mathbf{x}) & \cdots & (D_{n}f_{2}) (\mathbf{x}) \\ \vdots & \vdots & \ddots & \vdots \\ (D_{1}f_{m}) (\mathbf{x}) & (D_{2}f_{m}) (\mathbf{x}) & \cdots & (D_{n}f_{m}) (\mathbf{x}) \end{bmatrix}

全導関数は有限次元上で定義された関数に対する微分の最終形であり、ここでf\mathbf{f}の定義域、値域をバナッハ空間に一般化したものをフレシェ導関数という。一変数関数のときに成り立った性質も自然と成り立つ。

  • 一意性
  • 連鎖律

定理

一意性

E,x,fE, \mathbf{x}, \mathbf{f}定義での通りとする。A1,A2A_{1}, A_{2}(2)\eqref{2}を満たす場合、その二つの線形変換は等しい。

A1=A2 A_{1} = A_{2}

証明

B=A1A2B = A_{1} - A_{2}とする。すると、三角不等式により、次が成り立つ。

B(h)=A1(h)A2(h)=A1(h)f(x+h)f(x)+f(x+h)+f(x)A2(h)f(x+h)+f(x)A1(h)+f(x+h)+f(x)A2(h) \begin{align*} | B( \mathbf{h} ) | &= \left| A_{1}(\mathbf{h}) - A_{2}(\mathbf{h}) \right| \\ &= | A_{1}(\mathbf{h}) - \mathbf{f} (\mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) + \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \\ &\le | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(\mathbf{h}) | + | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \end{align*}

すると、固定されたh0\mathbf{h} \ne \mathbf{0}に対して、以下の式が成り立つ。

limt0B(th)thlimt0f(x+th)+f(x)A1(th)th+limt0f(x+th)+f(x)A2(th)th=0 \lim _{t \to 0} \dfrac{ | B( t\mathbf{h} ) |}{| t\mathbf{h} |} \le \lim _{t \to 0}\dfrac{ | \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(t\mathbf{h}) |}{| t\mathbf{h} |} + \lim _{t \to 0}\dfrac{| \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(t\mathbf{h}) |}{| t\mathbf{h} |}=0

しかし、BBは線形変換なので、左辺はttに無関係であることがわかる。

limt0tB(h)th=limt0B(h)h=B(h)h0 \lim _{t \to 0} \dfrac{ | tB( \mathbf{h} ) |}{| t\mathbf{h} |} = \lim _{t \to 0} \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} = \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} \le 0

h0\mathbf{h} \ne \mathbf{0}であるため、上記の式が成り立つには、B=0B=0でなければならない。したがって、次を得る。

B=A1A2=0    A1=A2 B=A_{1}-A_{2}=0 \implies A_{1} = A_{2}

連鎖律

定義の通り、ERnE \subset \R^{n}を開集合とし、f:ERm\mathbf{f} : E \to \R^{m}x0E\mathbf{x}_{0} \in Eで微分可能な関数とする。g:f(E)Rk\mathbf{g} : \mathbf{f}(E) \to \R^{k}f(x0)f(E)\mathbf{f}(\mathbf{x}_{0}) \in \mathbf{f}(E)で微分可能な関数とする。また、F:ERk\mathbf{F} : E \to \R^{k}f\mathbf{f}g\mathbf{g}合成とする。

F(x)=g(f(x)) \mathbf{F} (\mathbf{x}) = \mathbf{g} \left( \mathbf{f}(\mathbf{x}) \right)

すると、F\mathbf{F}x0\mathbf{x}_{0}で微分可能であり、全導関数は以下の通りである。

F(x0)=g(f(x0))f(x0) \mathbf{F}^{\prime} (\mathbf{x}_{0}) = \mathbf{g}^{\prime} \left( \mathbf{f}(\mathbf{x}_{0}) \right) \mathbf{f}^{\prime} (\mathbf{x}_{0})

証明

ノルム空間に対して一般化された証明


  1. Walter Rudin, Mathematical Analysisの原理 (第3版, 1976), p211-213 ↩︎