전 도함수: 다변수 벡터함수의 도함수

전 도함수: 다변수 벡터함수의 도함수

Total Derivative of Multivariable Vector Function

빌드업1

일변수함수의 도함수의 정의를 떠올려보자.

$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = f^{\prime}(x) $$

여기서 좌변의 분자를 아래와 같이 $h$에 대한 선형함수로 근사하면 다음과 같다.

$$ \begin{equation} f(x+h) - f(x) = a h + r(h) \label{1} \end{equation} $$

여기서 $r(h)$는 다음과 같은 조건을 만족하는 나머지remainder, 잔차라고 하자.

$$ \lim \limits_{h \to 0} \dfrac{r(h)}{h}=0 $$

그러면 $\eqref{1}$의 양변을 $h$로 나누고, $\lim_{h\to 0}$인 극한을 취하면 다음과 같다.

$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = \lim \limits_{h\to 0} \dfrac{ah+ r(h)}{h} = a + \lim \limits_{h\to 0} \dfrac{r(h)}{h} = a $$

이때 $a$는 $h$에 대한 선형근사에서 1차항의 계수였다. 이러한 센스에서 $a$를 $f$의 $x$에서의 미분 ‘계수’ 라고 부르는 것이다. 위 식을 살짝 변형하면 $f$의 $x$에서의 미분계수는 다음의 식을 만족하는 $a$라는 것을 알 수 있다.

$$ \lim \limits_{h\to 0} \dfrac{f(x+h) - f(x) - ah}{h} = \lim \limits_{h\to 0} \dfrac{r(h)}{h} = 0 $$

이를 토대로 다변수 벡터함수의 도함수를 정의한다.

정의

$E\subset \mathbb{R}^{n}$를 열린집합, $\mathbf{x}\in E$라고 하자. $\mathbf{f} : E \to \mathbb{R}^{m}$에 대해서, 다음을 만족하는 $\mathbf{h} \in \mathbb{R}^{n}$에 대한 선형변환 $A\in L(\mathbb{R}^{n}, \mathbb{R}^{m})$가 존재하면 $f$가 $\mathbf{x}$에서 미분가능하다고 한다. 또한 $A$를 $f$의 전 도함수total derivative 혹은 간단히 도함수 라고 하고 $\mathbf{f}’(\mathbf{x})$으로 표기한다.

$$ \begin{equation} \lim \limits_{|\mathbf{h}| \to 0} \dfrac{| \mathbf{f} ( \mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) - A( \mathbf{h} )|}{|\mathbf{h}|} = 0 \label{2} \end{equation} $$

만약 $\mathbf{f}$가 $E$의 모든 점에서 미분가능하면, $\mathbf{f}$가 $E$에서 미분가능하다고 한다.

설명

은 전체를 의미하며, 편 도함수에 대비되는 말이다. 전도 $\check{}$ 함수가 아니라 전 $\check{}$ 도함수이다.

주의해야할 점은 $\mathbf{f}^{\prime}(\mathbf{x})$는 $\mathbf{f}^{\prime}(\mathbf{x}) : E \subset \R^{n} \to \R^{m}$을 만족하는 선형변환이라는 것이다. 따라서 $\mathbf{f}^{\prime}(\mathbf{x}) = A$는 다음과 같이 행렬로 표현할 수 있다.

$$ \mathbf{f}^{\prime}(\mathbf{x}) = A = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} $$

그러면 $\mathbf{f}$의 전 도함수 $\mathbf{f}^{\prime}$는 $\mathbf{x} \in E \subset \R^{n}$이 주어질 때 마다 어떤 $m \times n$ 행렬 $A$를 매핑하는 함수라고 볼 수 있다. 이 행렬은 $\mathbf{f}$의 편 도함수로부터 쉽게 구할 수 있으며 이를 자코비안Jacobian matrix, 야코비 행렬이라고도 한다.

$$ \mathbf{f}^{\prime}(\mathbf{x}) = \begin{bmatrix} (D_{1}f_{1}) (\mathbf{x}) & (D_{2}f_{1}) (\mathbf{x}) & \cdots & (D_{n}f_{1}) (\mathbf{x}) \\ (D_{1}f_{2}) (\mathbf{x}) & (D_{2}f_{2}) (\mathbf{x}) & \cdots & (D_{n}f_{2}) (\mathbf{x}) \\ \vdots & \vdots & \ddots & \vdots \\ (D_{1}f_{m}) (\mathbf{x}) & (D_{2}f_{m}) (\mathbf{x}) & \cdots & (D_{n}f_{m}) (\mathbf{x}) \end{bmatrix} $$

전 도함수는 유한차원 위에서 정의된 함수에 대해서는 미분 일반화의 끝판왕이며, 여기서 $\mathbf{f}$의 정의역, 공역을 바나흐 공간으로 일반화한 것을 프레셰 도함수라고 한다. 일변수함수일 때 성립했던 성질들도 당연히 성립한다.

  • 유일성
  • 연쇄법칙

정리

유일성

$E, \mathbf{x}, \mathbf{f}$를 정의에서와 같다고 하자. $A_{1}, A_{2}$가 $\eqref{2}$를 만족시킨다고 하자. 그러면 두 선형변환은 같다.

$$ A_{1} = A_{2} $$

증명

$B = A_{1} - A_{2}$라고 하자. 그러면 삼각부등식에 의해서 다음이 성립한다.

$$ \begin{align*} | B( \mathbf{h} ) | &= \left| A_{1}(\mathbf{h}) - A_{2}(\mathbf{h}) \right| \\ &= | A_{1}(\mathbf{h}) - \mathbf{f} (\mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) + \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \\ &\le | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(\mathbf{h}) | + | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) | \end{align*} $$

그러면 고정된 $\mathbf{h} \ne \mathbf{0}$에 대해서 아래의 식이 성립한다.

$$ \lim _{t \to 0} \dfrac{ | B( t\mathbf{h} ) |}{| t\mathbf{h} |} \le \lim _{t \to 0}\dfrac{ | \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(t\mathbf{h}) |}{| t\mathbf{h} |} + \lim _{t \to 0}\dfrac{| \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(t\mathbf{h}) |}{| t\mathbf{h} |}=0 $$

그런데 $B$는 선형변환이므로 좌변은 $t$에 무관한 값이라는 것을 알 수 있다.

$$ \lim _{t \to 0} \dfrac{ | tB( \mathbf{h} ) |}{| t\mathbf{h} |} = \lim _{t \to 0} \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} = \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} \le 0 $$

$\mathbf{h} \ne \mathbf{0}$이므로 위 식이 성립하기위해서는 $B=0$이어야한다. 따라서 다음을 얻는다.

$$ B=A_{1}-A_{2}=0 \implies A_{1} = A_{2} $$

연쇄법칙

정의에서와 같이 $E \subset \R^{n}$을 열린집합, $\mathbf{f} : E \to \R^{m}$를 $\mathbf{x}_{0} \in E$에서 미분가능한 함수라고 하자. $\mathbf{g} : \mathbf{f}(E) \to \R^{k}$를 $\mathbf{f}(\mathbf{x}_{0}) \in \mathbf{f}(E)$에서 미분가능한 함수하고 하자. 그리고 $\mathbf{F} : E \to \R^{k}$를 다음과 같이 $\mathbf{f}$와 $\mathbf{g}$의 합성이라고 하자.

$$ \mathbf{F} (\mathbf{x}) = \mathbf{g} \left( \mathbf{f}(\mathbf{x}) \right) $$

그러면 $\mathbf{F}$는 $\mathbf{x}_{0}$에서 미분가능하고, 전 도함수는 다음과 같다.

$$ \mathbf{F}^{\prime} (\mathbf{x}_{0}) = \mathbf{g}^{\prime} \left( \mathbf{f}(\mathbf{x}_{0}) \right) \mathbf{f}^{\prime} (\mathbf{x}_{0}) $$

증명

놈 공간에 대해서 일반화된 증명


  1. Walter Rudin, Principles of Mathmatical Analysis (3rd Edition, 1976), p211-213 ↩︎

댓글