해석학에서 미분의 연쇄 법칙
정리1
$f :[a,b] \to \mathbb{R}$가 연속함수이고, $x\in [a,b]$에서 미분가능하다고 하자. $g : f([a,b])\to \mathbb{R}$가 $f (x)\in f([a,b])$에서 미분가능하다고 하자. 그리고 $h : [a,b] \to \mathbb{R}$을 다음과 같다고 하자.
$$ h(t)=g\left( f(t) \right)\quad (a\le t \le b) $$
그러면 $h$는 $x$에서 미분 가능하고 그 값은 아래와 같다.
$$ h^{\prime}(x)=g^{\prime}(f(x))f^{\prime}(x) $$ 합성 함수기호를 사용하면 다음과 같다. $$ ( g \circ f)^{\prime}(x)=g^{\prime}(f(x))f^{\prime}(x) $$
설명
이 결과를 흔히 연쇄법칙chain rule이라 부른다.
이때 $f^{\prime}(x)$를 속미분이라고도 부른다. $y=f(x)$, $z=g(y)$라고 두고 라이프니츠 표기법으로 나타내면 다음과 같다. $$ \frac{dz}{dx}=\frac{dz}{dy}\frac{dy}{dx} $$
라이프니츠 표기법이 편리한 이유는 위 식의 좌변이 마치 우변을 약분한 것처럼 보이기 때문이다. $\dfrac{dy}{dx}$는 ‘디엑스 분의 디와이’가 아니라 $y$의 도함수이지만 분수처럼 다뤄도 그 의미가 찰떡같이 들어맞는다.
증명
우선 아래와 같은 함수 $G$를 정의하자.
$$ G(f(t)) :=\begin{cases} \frac{g(f(x))-g(f(t))}{f(x)-f(t)} -g^{\prime}(f(x)) & f(t) \ne f(x) \\ 0 & f(t)=f(x)\end{cases},\quad (t\in[a,b]) $$
그러면 모든 $f(t)$에 대해서 다음이 성립한다.
$$ \lim \limits_{ f(s) \to f(t) } G(f(s))=G(f(t)) $$
이는 연속일 동치 조건이므로 $G$는 연속함수이다. 또한 다음이 성립한다.
$$ h(x)-h(t) = g(f(x))-g(f(t))=\Big( f(x)-f(t) \Big) \Big( g^{\prime}(f(x))+G(f(t)) \Big) $$
그러면 극한의 성질에 의해 아래의 식이 성립한다.
$$ \begin{align*} h^{\prime}(x) =&\ \lim \limits_{t \to x} \frac{ h(x)-h(t)}{x-t} \\ =&\ \lim \limits_{t \to x} \frac{ \Big( f(x)-f(t) \Big) \Big( g^{\prime}(f(x))+G(f(t)) \Big)}{x-t} \\ =&\ \lim \limits_{t \to x} \left[ g^{\prime}(f(x))\frac{ f(x)-f(t) }{x-t}+G(f(t))\frac{f(x)-f(t) }{x-t} \right] \\ =&\ \lim \limits_{t \to x} \left[ g^{\prime}(f(x))\frac{ f(x)-f(t) }{x-t}\right]+\lim \limits_{t \to x} \left[G(f(t))\frac{ f(x)-f(t) }{x-t} \right] \\ =&\ \lim \limits_{t \to x} g^{\prime}(f(x))\lim \limits_{t \to x}\frac{ f(x)-f(t) }{x-t}+\lim \limits_{t \to x}G(f(t))\lim \limits_{t \to x}\frac{ f(x)-f(t) }{x-t} \\ =&\ g^{\prime}(f(x))f^{\prime}(x)+0\cdot f^{\prime}(x) \\ =&\ g^{\prime}(f(x))f^{\prime}(x) \end{align*} $$
■
Walter Rudin, Principles of Mathmatical Analysis (3rd Edition, 1976), p105 ↩︎