전 도함수: 다변수 벡터함수의 도함수
📂다변수벡터해석 전 도함수: 다변수 벡터함수의 도함수 빌드업 일변수함수의 도함수의 정의 를 떠올려보자.
lim h → 0 f ( x + h ) − f ( x ) h = f ′ ( x )
\lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = f^{\prime}(x)
h → 0 lim h f ( x + h ) − f ( x ) = f ′ ( x )
여기서 좌변의 분자를 아래와 같이 h h h 에 대한 선형함수 로 근사하면 다음과 같다.
f ( x + h ) − f ( x ) = a h + r ( h )
\begin{equation}
f(x+h) - f(x) = a h + r(h)
\label{1}
\end{equation}
f ( x + h ) − f ( x ) = ah + r ( h )
여기서 r ( h ) r(h) r ( h ) 는 다음과 같은 조건을 만족하는 나머지 remainder, 잔차 라고 하자.
lim h → 0 r ( h ) h = 0
\lim \limits_{h \to 0} \dfrac{r(h)}{h}=0
h → 0 lim h r ( h ) = 0
그러면 ( 1 ) \eqref{1} ( 1 ) 의 양변을 h h h 로 나누고, lim h → 0 \lim_{h\to 0} lim h → 0 인 극한을 취하면 다음과 같다.
lim h → 0 f ( x + h ) − f ( x ) h = lim h → 0 a h + r ( h ) h = a + lim h → 0 r ( h ) h = a
\lim \limits_{h\to 0} \dfrac{f(x+h) - f(x)}{h} = \lim \limits_{h\to 0} \dfrac{ah+ r(h)}{h} = a + \lim \limits_{h\to 0} \dfrac{r(h)}{h} = a
h → 0 lim h f ( x + h ) − f ( x ) = h → 0 lim h ah + r ( h ) = a + h → 0 lim h r ( h ) = a
이때 a a a 는 h h h 에 대한 선형근사에서 1차항의 계수였다. 이러한 센스에서 a a a 를 f f f 의 x x x 에서의 미분 ‘계수’ 라고 부르는 것이다. 위 식을 살짝 변형하면 f f f 의 x x x 에서의 미분계수는 다음의 식을 만족하는 a a a 라는 것을 알 수 있다.
lim h → 0 f ( x + h ) − f ( x ) − a h h = lim h → 0 r ( h ) h = 0
\lim \limits_{h\to 0} \dfrac{f(x+h) - f(x) - ah}{h} = \lim \limits_{h\to 0} \dfrac{r(h)}{h} = 0
h → 0 lim h f ( x + h ) − f ( x ) − ah = h → 0 lim h r ( h ) = 0
이를 토대로 다변수 벡터함수의 도함수를 정의한다.
정의 E ⊂ R n E\subset \mathbb{R}^{n} E ⊂ R n 를 열린집합 , x ∈ E \mathbf{x}\in E x ∈ E 라고 하자. f : E → R m \mathbf{f} : E \to \mathbb{R}^{m} f : E → R m 에 대해서, 다음을 만족하는 h ∈ R n \mathbf{h} \in \mathbb{R}^{n} h ∈ R n 에 대한 선형변환 A ∈ L ( R n , R m ) A\in L(\mathbb{R}^{n}, \mathbb{R}^{m}) A ∈ L ( R n , R m ) 가 존재하면 f f f 가 x \mathbf{x} x 에서 미분가능하다고 한다. 또한 A A A 를 f f f 의 전 도함수 total derivative 혹은 간단히 도함수 라고 하고 f ′ ( x ) \mathbf{f}^{\prime}(\mathbf{x}) f ′ ( x ) 으로 표기한다.
lim ∣ h ∣ → 0 ∣ f ( x + h ) − f ( x ) − A ( h ) ∣ ∣ h ∣ = 0
\begin{equation}
\lim \limits_{|\mathbf{h}| \to 0} \dfrac{| \mathbf{f} ( \mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) - A( \mathbf{h} )|}{|\mathbf{h}|} = 0
\label{2}
\end{equation}
∣ h ∣ → 0 lim ∣ h ∣ ∣ f ( x + h ) − f ( x ) − A ( h ) ∣ = 0
만약 f \mathbf{f} f 가 E E E 의 모든 점에서 미분가능하면, f \mathbf{f} f 가 E E E 에서 미분가능하다고 한다.
설명 전全 은 전체를 의미하며, 편 도함수 에 대비되는 말이다. 전도 ˇ \check{} ˇ 함수가 아니라 전 ˇ \check{} ˇ 도함수이다.
주의해야할 점은 f ′ ( x ) \mathbf{f}^{\prime}(\mathbf{x}) f ′ ( x ) 는 함숫값이 아니라, f ′ ( x ) : E ⊂ R n → R m \mathbf{f}^{\prime}(\mathbf{x}) : E \subset \R^{n} \to \R^{m} f ′ ( x ) : E ⊂ R n → R m 을 만족하는 선형변환 이라는 것이다. 따라서 f ′ ( x ) = A \mathbf{f}^{\prime}(\mathbf{x}) = A f ′ ( x ) = A 는 다음과 같이 행렬로 표현할 수 있다.
f ′ ( x ) = A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ]
\mathbf{f}^{\prime}(\mathbf{x}) = A
= \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}
f ′ ( x ) = A = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a mn
그러면 f \mathbf{f} f 의 전 도함수 f ′ \mathbf{f}^{\prime} f ′ 는 x ∈ E ⊂ R n \mathbf{x} \in E \subset \R^{n} x ∈ E ⊂ R n 이 주어질 때 마다 어떤 m × n m \times n m × n 행렬 A A A 를 매핑하는 함수라고 볼 수 있다. 이 행렬은 f \mathbf{f} f 의 편 도함수 로부터 쉽게 구할 수 있으며 이를 자코비안 Jacobian matrix, 야코비 행렬 이라고도 한다.
f ′ ( x ) = [ ( D 1 f 1 ) ( x ) ( D 2 f 1 ) ( x ) ⋯ ( D n f 1 ) ( x ) ( D 1 f 2 ) ( x ) ( D 2 f 2 ) ( x ) ⋯ ( D n f 2 ) ( x ) ⋮ ⋮ ⋱ ⋮ ( D 1 f m ) ( x ) ( D 2 f m ) ( x ) ⋯ ( D n f m ) ( x ) ]
\mathbf{f}^{\prime}(\mathbf{x})
= \begin{bmatrix}
(D_{1}f_{1}) (\mathbf{x}) & (D_{2}f_{1}) (\mathbf{x}) & \cdots & (D_{n}f_{1}) (\mathbf{x})
\\ (D_{1}f_{2}) (\mathbf{x}) & (D_{2}f_{2}) (\mathbf{x}) & \cdots & (D_{n}f_{2}) (\mathbf{x})
\\ \vdots & \vdots & \ddots & \vdots
\\ (D_{1}f_{m}) (\mathbf{x}) & (D_{2}f_{m}) (\mathbf{x}) & \cdots & (D_{n}f_{m}) (\mathbf{x})
\end{bmatrix}
f ′ ( x ) = ( D 1 f 1 ) ( x ) ( D 1 f 2 ) ( x ) ⋮ ( D 1 f m ) ( x ) ( D 2 f 1 ) ( x ) ( D 2 f 2 ) ( x ) ⋮ ( D 2 f m ) ( x ) ⋯ ⋯ ⋱ ⋯ ( D n f 1 ) ( x ) ( D n f 2 ) ( x ) ⋮ ( D n f m ) ( x )
전 도함수는 유한차원 위에서 정의된 함수에 대해서는 미분 일반화의 끝판왕이며, 여기서 f \mathbf{f} f 의 정의역, 공역을 바나흐 공간 으로 일반화한 것을 프레셰 도함수 라고 한다. 일변수함수일 때 성립했던 성질들도 당연히 성립한다.
정리 유일성 E , x , f E, \mathbf{x}, \mathbf{f} E , x , f 를 정의 에서와 같다고 하자. A 1 , A 2 A_{1}, A_{2} A 1 , A 2 가 ( 2 ) \eqref{2} ( 2 ) 를 만족시킨다고 하자. 그러면 두 선형변환은 같다.
A 1 = A 2
A_{1} = A_{2}
A 1 = A 2
증명 B = A 1 − A 2 B = A_{1} - A_{2} B = A 1 − A 2 라고 하자. 그러면 삼각부등식에 의해서 다음이 성립한다.
∣ B ( h ) ∣ = ∣ A 1 ( h ) − A 2 ( h ) ∣ = ∣ A 1 ( h ) − f ( x + h ) − f ( x ) + f ( x + h ) + f ( x ) − A 2 ( h ) ∣ ≤ ∣ f ( x + h ) + f ( x ) − A 1 ( h ) ∣ + ∣ f ( x + h ) + f ( x ) − A 2 ( h ) ∣
\begin{align*}
| B( \mathbf{h} ) | &= \left| A_{1}(\mathbf{h}) - A_{2}(\mathbf{h}) \right|
\\ &= | A_{1}(\mathbf{h}) - \mathbf{f} (\mathbf{x} + \mathbf{h}) - \mathbf{f} (\mathbf{x}) + \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) |
\\ &\le | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(\mathbf{h}) | + | \mathbf{f} (\mathbf{x} + \mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(\mathbf{h}) |
\end{align*}
∣ B ( h ) ∣ = ∣ A 1 ( h ) − A 2 ( h ) ∣ = ∣ A 1 ( h ) − f ( x + h ) − f ( x ) + f ( x + h ) + f ( x ) − A 2 ( h ) ∣ ≤ ∣ f ( x + h ) + f ( x ) − A 1 ( h ) ∣ + ∣ f ( x + h ) + f ( x ) − A 2 ( h ) ∣
그러면 고정된 h ≠ 0 \mathbf{h} \ne \mathbf{0} h = 0 에 대해서 아래의 식이 성립한다.
lim t → 0 ∣ B ( t h ) ∣ ∣ t h ∣ ≤ lim t → 0 ∣ f ( x + t h ) + f ( x ) − A 1 ( t h ) ∣ ∣ t h ∣ + lim t → 0 ∣ f ( x + t h ) + f ( x ) − A 2 ( t h ) ∣ ∣ t h ∣ = 0
\lim _{t \to 0} \dfrac{ | B( t\mathbf{h} ) |}{| t\mathbf{h} |} \le \lim _{t \to 0}\dfrac{ | \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{1}(t\mathbf{h}) |}{| t\mathbf{h} |} + \lim _{t \to 0}\dfrac{| \mathbf{f} (\mathbf{x} + t\mathbf{h}) + \mathbf{f} (\mathbf{x}) - A_{2}(t\mathbf{h}) |}{| t\mathbf{h} |}=0
t → 0 lim ∣ t h ∣ ∣ B ( t h ) ∣ ≤ t → 0 lim ∣ t h ∣ ∣ f ( x + t h ) + f ( x ) − A 1 ( t h ) ∣ + t → 0 lim ∣ t h ∣ ∣ f ( x + t h ) + f ( x ) − A 2 ( t h ) ∣ = 0
그런데 B B B 는 선형변환이므로 좌변은 t t t 에 무관한 값이라는 것을 알 수 있다.
lim t → 0 ∣ t B ( h ) ∣ ∣ t h ∣ = lim t → 0 ∣ B ( h ) ∣ ∣ h ∣ = ∣ B ( h ) ∣ ∣ h ∣ ≤ 0
\lim _{t \to 0} \dfrac{ | tB( \mathbf{h} ) |}{| t\mathbf{h} |} = \lim _{t \to 0} \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} = \dfrac{ | B( \mathbf{h} ) |}{| \mathbf{h} |} \le 0
t → 0 lim ∣ t h ∣ ∣ tB ( h ) ∣ = t → 0 lim ∣ h ∣ ∣ B ( h ) ∣ = ∣ h ∣ ∣ B ( h ) ∣ ≤ 0
h ≠ 0 \mathbf{h} \ne \mathbf{0} h = 0 이므로 위 식이 성립하기위해서는 B = 0 B=0 B = 0 이어야한다. 따라서 다음을 얻는다.
B = A 1 − A 2 = 0 ⟹ A 1 = A 2
B=A_{1}-A_{2}=0 \implies A_{1} = A_{2}
B = A 1 − A 2 = 0 ⟹ A 1 = A 2
■
연쇄법칙 정의에서와 같이 E ⊂ R n E \subset \R^{n} E ⊂ R n 을 열린집합, f : E → R m \mathbf{f} : E \to \R^{m} f : E → R m 를 x 0 ∈ E \mathbf{x}_{0} \in E x 0 ∈ E 에서 미분가능한 함수라고 하자. g : f ( E ) → R k \mathbf{g} : \mathbf{f}(E) \to \R^{k} g : f ( E ) → R k 를 f ( x 0 ) ∈ f ( E ) \mathbf{f}(\mathbf{x}_{0}) \in \mathbf{f}(E) f ( x 0 ) ∈ f ( E ) 에서 미분가능한 함수하고 하자. 그리고 F : E → R k \mathbf{F} : E \to \R^{k} F : E → R k 를 다음과 같이 f \mathbf{f} f 와 g \mathbf{g} g 의 합성 이라고 하자.
F ( x ) = g ( f ( x ) )
\mathbf{F} (\mathbf{x}) = \mathbf{g} \left( \mathbf{f}(\mathbf{x}) \right)
F ( x ) = g ( f ( x ) )
그러면 F \mathbf{F} F 는 x 0 \mathbf{x}_{0} x 0 에서 미분가능하고, 전 도함수는 다음과 같다.
F ′ ( x 0 ) = g ′ ( f ( x 0 ) ) f ′ ( x 0 )
\mathbf{F}^{\prime} (\mathbf{x}_{0}) = \mathbf{g}^{\prime} \left( \mathbf{f}(\mathbf{x}_{0}) \right) \mathbf{f}^{\prime} (\mathbf{x}_{0})
F ′ ( x 0 ) = g ′ ( f ( x 0 ) ) f ′ ( x 0 )
증명 놈 공간에 대해서 일반화된 증명
■