logo

이원수 환 위에서 정의되는 미분가능한 실함수 📂추상대수

이원수 환 위에서 정의되는 미분가능한 실함수

빌드업1

매끄러운 함수 $f : \mathbb{R} \to \mathbb{R}$가 주어졌다고 하자. $f$의 $a$에서의 테일러 급수는 다음과 같다.

$$ \begin{align*} f(x) &= f(a) + f^{\prime}(a)(x - a) + \dfrac{f^{\prime \prime}(a)}{2!}(x - a)^{2} + \cdots \\ &= f(a) + f^{\prime}(a)(x - a) + \sum_{n=2}^{\infty} \dfrac{f^{(n)}(a)}{n!}(x - a)^{n} \end{align*} $$

위의 식은 실수공간 위에서 정의된 함수에 대해서 얻어진 것이지만, $x$ 대신에 이원수 $a + b\epsilon = (a, b)$를 대입해보자.

$$ \begin{align*} f(a + b\epsilon) &= f(a) + f^{\prime}(a)(a + b\epsilon - a) + \sum_{n=2}^{\infty} \dfrac{f^{(n)}(a)}{n!}(a + b\epsilon - a)^{n} \\ &= f(a) + f^{\prime}(a)b\epsilon + \sum_{n=2}^{\infty} \dfrac{f^{(n)}(a)}{n!}b^{n}\epsilon^{n} \\ &= f(a) + f^{\prime}(a)b\epsilon \\ &= \big( f(a), b f^{\prime}(a) \big) \end{align*} $$

$\epsilon^{2} = 0$이므로 세번째항 이후부터는 모두 $0$이다.

정의

미분가능한 함수 $f : \mathbb{R} \to \mathbb{R}$이 주어졌다고 하자. 이원수 $a + b\epsilon$에 대해서, $f(a + b\epsilon)$를 다음과 같이 정의한다.

$$ f(a + b\epsilon) := \big( f(a), b f^{\prime}(a) \big) \tag{1} $$

설명

$(1)$에서 표기를 남용abuse of notation하였음을 주의하라. $(1)$의 좌변의 $f$는 사실 고정된 $f$에 대해서 다음과 같이 정의되는 함수이다.

$$ \begin{align*} F_{f} : \left\{ a + b\epsilon : a, b \in \mathbb{R} \right\} &\to \left\{ a + b\epsilon : a, b \in \mathbb{R} \right\} \\ a + b\epsilon &\mapsto f(a) + b f^{\prime}(a)\epsilon = \big( f(a), b f^{\prime}(a) \big) \end{align*} $$

하지만 $b = 0$인 경우를 생각해보면 $F_{f}(a,0) = (f(a), 0)$이므로 $f$에 대해서 자연스럽게 확장된 것을 알 수 있다. 그래서 편의를 위해 $f \equiv F_{f}$로 표기했다는 것에 유의하자.

실수 $x$를 이원수 $(x, 1)$로 확장시켜 덧셈이나 곱셈을 계산하면 두번째 성분에서 미분계수가 보존된다. 따라서 위의 정의는 미분계수를 보존하는 관점에서 굉장히 자연스럽게 정의되었다는 것을 알 수 있다.

합성 함수

합성 함수 $f \circ g$에 대해서, $f \circ g (a + b\epsilon)$을 다음과 같이 정의한다.

$$ f \circ g (a + b\epsilon) := f(g(a)) + f^{\prime}(g(a)) g^{\prime}(a)b\epsilon = \big( f(g(a)), b f^{\prime}(g(a)) g^{\prime}(a) \big) $$

첫번째 성분은 $f \circ g$의 $a$에서의 함숫값이고, 두번째 성분은 미분계수라는 것을 알 수 있다.

유도

정의 $(1)$대로 계산하면 바로 얻는다.

$$ \begin{align*} f \circ g (a + b\epsilon) &= f(g(a + b\epsilon)) \\ &= f(g(a) + g^{\prime}(a)b\epsilon) \\ &= f(g(a)) + f^{\prime}(g(a)) g^{\prime}(a)b\epsilon \\ &= \big( f(g(a)), b f^{\prime}(g(a)) g^{\prime}(a) \big) \end{align*} $$

같이보기


  1. Mykel J. Kochenderfer, Algorithms for Optimization (2019), p27-32 ↩︎