偏導関数:多変数ベクトル関数の導関数
ビルドアップ1
一変数関数の導関数の定義を思い出そう。
$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = f^{\prime}(x) $$
左辺の分子を$h$に対する線形関数で近似すると、次のようになる。
$$ \begin{equation} f(x+h) - f(x) = a h + r(h) \label{1} \end{equation} $$
ここで、$r(h)$を以下の条件を満たす残余remainder, 残差としよう。
$$ \lim \limits_{h \to 0} \dfrac{r(h)}{h}=0 $$
すると、$\eqref{1}$の両辺を$h$で割り、$\lim_{h\to 0}$である極限を取ると、次のようになる。
$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = \lim \limits_{h\to 0} \dfrac{ah+ r(h)}{h} = a + \lim \limits_{h\to 0} \dfrac{r(h)}{h} = a $$
この時、$a$は$h$に対する線形近似での1次項の係数であった。このセンスで、$a$を$f$の$x$での微分**‘係数’**と呼ぶことにする。式を少し変形すると、$f$の$x$での微分係数は、$a$を満たす式であることがわかる。
$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x) - ah}{h} = \lim \limits_{h\to 0} \dfrac{r(h)}{h} = 0 $$
これを基に多変数ベクトル関数の導関数を定義する。
定義
$E\subset \mathbb{R}^{n}$を開集合、$\mathbf{x}\in E$とする。$\mathbf{f} : E \to \mathbb{R}^{m}$に対して、次を満たす$\mathbf{h} \in \mathbb{R}^{n}$に対する線形変換 $A\in L(\mathbb{R}^{n}, \mathbb{R}^{m})$が存在する場合、$f$は$\mathbf{x}$で微分可能とされる。また、$A$を$f$の全導関数total derivativeまたは単に導関数といい、$\mathbf{f}^{\prime}(\mathbf{x})$で表記する。
$$ \begin{equation} \lim \limits_{|\mathbf{h}| \to 0} \dfrac{| \mathbf{f} ( \mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) - A( \mathbf{h} )|}{|\mathbf{h}|} = 0 \label{2} \end{equation} $$
もし$\mathbf{f}$が$E$のすべての点で微分可能であれば、$\mathbf{f}$は$E$で微分可能であるとされる。
説明
全全は全体を意味し、偏導関数に対する言葉だ。全$\check{}$関数ではなく、全$\check{}$導関数である。
注意すべき点は、$\mathbf{f}^{\prime}(\mathbf{x})$は関数値ではなく、$\mathbf{f}^{\prime}(\mathbf{x}) : E \subset \R^{n} \to \R^{m}$を満たす線形変換であることだ。したがって、$\mathbf{f}^{\prime}(\mathbf{x}) = A$は次のように行列で表現できる。
$$ \mathbf{f}^{\prime}(\mathbf{x}) = A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} $$
すると、$\mathbf{f}$の全導関数$\mathbf{f}^{\prime}$は、$\mathbf{x} \in E \subset \R^{n}$が与えられるたびにある$m \times n$行列$A$をマッピングする関数と見なすことができる。この行列は$\mathbf{f}$の偏導関数から簡単に得ることができ、ヤコビ行列Jacobian matrix, ヤコビ行列とも呼ばれる。
$$ \mathbf{f}^{\prime}(\mathbf{x}) = \begin{bmatrix} (D_{1}f_{1}) (\mathbf{x}) & (D_{2}f_{1}) (\mathbf{x}) & \cdots & (D_{n}f_{1}) (\mathbf{x}) \\ (D_{1}f_{2}) (\mathbf{x}) & (D_{2}f_{2}) (\mathbf{x}) & \cdots & (D_{n}f_{2}) (\mathbf{x}) \\ \vdots & \vdots & \ddots & \vdots \\ (D_{1}f_{m}) (\mathbf{x}) & (D_{2}f_{m}) (\mathbf{x}) & \cdots & (D_{n}f_{m}) (\mathbf{x}) \end{bmatrix} $$
全導関数は有限次元上で定義された関数に対する微分の最終形であり、ここで$\mathbf{f}$の定義域、値域をバナッハ空間に一般化したものをフレシェ導関数という。一変数関数のときに成り立った性質も自然と成り立つ。
- 一意性
- 連鎖律
定理
一意性
$E, \mathbf{x}, \mathbf{f}$を定義での通りとする。$A_{1}, A_{2}$が$\eqref{2}$を満たす場合、その二つの線形変換は等しい。
$$ A_{1} = A_{2} $$
証明
$B = A_{1} - A_{2}$とする。すると、三角不等式により、次が成り立つ。
$$ \begin{align*} | B( \mathbf{h} ) | &= \left| A_{1}(\mathbf{h}) - A_{2}(\mathbf{h}) \right| \\ &= | A_{1}(\mathbf{h}) - \mathbf{f} (\mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) + \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \\ &\le | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(\mathbf{h}) | + | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \end{align*} $$
すると、固定された$\mathbf{h} \ne \mathbf{0}$に対して、以下の式が成り立つ。
$$ \lim _{t \to 0} \dfrac{ | B( t\mathbf{h} ) |}{| t\mathbf{h} |} \le \lim _{t \to 0}\dfrac{ | \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(t\mathbf{h}) |}{| t\mathbf{h} |} + \lim _{t \to 0}\dfrac{| \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(t\mathbf{h}) |}{| t\mathbf{h} |}=0 $$
しかし、$B$は線形変換なので、左辺は$t$に無関係であることがわかる。
$$ \lim _{t \to 0} \dfrac{ | tB( \mathbf{h} ) |}{| t\mathbf{h} |} = \lim _{t \to 0} \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} = \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} \le 0 $$
$\mathbf{h} \ne \mathbf{0}$であるため、上記の式が成り立つには、$B=0$でなければならない。したがって、次を得る。
$$ B=A_{1}-A_{2}=0 \implies A_{1} = A_{2} $$
■
連鎖律
定義の通り、$E \subset \R^{n}$を開集合とし、$\mathbf{f} : E \to \R^{m}$を$\mathbf{x}_{0} \in E$で微分可能な関数とする。$\mathbf{g} : \mathbf{f}(E) \to \R^{k}$を$\mathbf{f}(\mathbf{x}_{0}) \in \mathbf{f}(E)$で微分可能な関数とする。また、$\mathbf{F} : E \to \R^{k}$を$\mathbf{f}$と$\mathbf{g}$の合成とする。
$$ \mathbf{F} (\mathbf{x}) = \mathbf{g} \left( \mathbf{f}(\mathbf{x}) \right) $$
すると、$\mathbf{F}$は$\mathbf{x}_{0}$で微分可能であり、全導関数は以下の通りである。
$$ \mathbf{F}^{\prime} (\mathbf{x}_{0}) = \mathbf{g}^{\prime} \left( \mathbf{f}(\mathbf{x}_{0}) \right) \mathbf{f}^{\prime} (\mathbf{x}_{0}) $$
証明
■
Walter Rudin, Mathematical Analysisの原理 (第3版, 1976), p211-213 ↩︎