편미분의 기호를 다르게 쓰는 이유 📂다변수벡터해석

편미분의 기호를 다르게 쓰는 이유

질문

편도함수에는 보통의 미분과 달리 $\displaystyle {{ d f } \over { d t }}$ 대신 $\displaystyle {{ \partial f } \over { \partial t }}$ 과 같은 표현을 사용한다. $\partial$ 은 [라운드-디]^{round dee} 혹은 [파셜]^partial이라 읽으며, 역사적으로도 $d$ 를 굴려 쓴 [컬리-디]^{curly dee}로 유래했다¹. $\TeX$ 코드로는 \partial이고, 한국에서는 [라운드-디]조차 길다고 생각하는지 그냥 [라운드]라 읽는 사람도 많다.

왜 $d$ 를 $\partial$ 로 쓰는가?

문제는 편미분이라는 게 그냥 다른 변수에 대해서 미분할 뿐인데 굳이 기호를 다르게 쓰는 이유를 납득하기 어렵다는 것이다. 학부 수업 수준이라면 편미분이 처음 등장할 때마다 반드시 나오는 질문이나, 막상 대답은 수학과가 아니라면 “그런 건 수학과나 고민하는 것이다” 혹은 수학과라고 해도 “그냥 노테이션의 차이로 받아들여도 무방하다” 정도로 돌아올 수 있다. 이게 딱히 틀린 말도 아닌 게, $d$ 로 쓰든 $\partial$ 로 쓰든 수학과가 아니라면 그게 딱히 중요한 것도 아니고 수학과라고 해도 수식의 의미 자체가 달라지는 게 아닌 건 사실이다. 예를 들어 열방정식을 공부한다는 맥락이라면, $$ {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} $$ 의 $\partial$ 을 상미분 표현 $d$ 로 바꿔서 $$ {{ d u } \over { d t }} = {{ d u } \over { d x^{2} }} $$ 로 적었을 때 두 방정식이 같냐고 물어볼 수 있을 것이다. 매우 혼란스럽게도 그 대답은 ‘실제로 같다’기 때문에, 이쯤에서 많은 학생들이 $d$ 와 $\partial$ 의 구분에 의미가 없다고 느끼거나 정의 수준으로 받아들이고 넘어가게 된다.

답변

뉴턴과 라이프니츠

본격적인 편미분 이야기에 앞서, 재미있는 읽을거리로써 미분의 두 아버지인 뉴턴^Newton과 라이프니츠^Leibniz의 이야기를 꺼내려 한다. 현대에 와서 두 사람은 서로 독자적으로 미분의 개념 및 표기를 고안했다고 인정 받는데, 함수 $y = f(x)$ 에 대해 그 도함수를 나타낼 때 뉴턴은 $$ y ' = f ' (x) $$ 와 같은 표기를 사용했고 라이프니츠는 $$ {{ dy } \over { dx }} = {{ d f(x) } \over { dx }} $$ 와 같은 표기를 사용했다. 같은 미분임에도 이렇게 표현의 차이가 나는 것은 이들의 사고방식과 미적분을 바라보는 관점 자체가 달랐기 때문인데, 지금 보면 동시대에 독자적으로 미분을 고안한 사람이 한 명 더 있었어도 좋았겠다 싶을 정도로 다행스러운 일이다. 뉴턴은 고전역학의 거장으로써 ‘위치를 한 번 미분하면 속도, 두 번 미분하면 가속도’와 같은 이야기를 많이 할 수 밖에 없었고 이 때 $$ \begin{align*} v =& x ' \\ a =& v ' = x '' \end{align*} $$ 같은 표현은 매우 깔끔하고 효율적이다. 라이프니츠는 기하적^geometric으로 봤을 때 더 일리가 있는데, 직선의 기울기가 가로 세로의 변화량의 비로써 정의되니까 곡선에서는 아주 작은 단위를 주어 $$ {{ \Delta y } \over { \Delta x }} \approx {{ d y } \over { d x }} $$ 와 같이 접선의 기울기에 자연스럽게 접근할 수 있다. 재미있는 건 지금까지 말한 게 상미분^{ordinary differential}임에도 분야에 따라서는 다음과 같은 노테이션의 분화가 일어나며, 뉴턴과 라이프니츠의 노테이션이 양립할 수 있다는 사실이다.

미분기하에서 $s$ 에 대한 미분과 $t$ 에 대한 미분의 표기: $$ {{ df } \over { ds }} = f^{\prime} \quad \text{and} \quad {{ df } \over { dt }} = \dot{f} $$ 닷 $\dot{}$ 이나 프라임 $'$ 이나 똑같이 미분은 미분인데, 미분 기하학의 맥락에서는 위와 같이 기호를 구분할 수 있다. 보통 $s$ 는 단위 스피드 곡선의 매개변수고 $t = t(s)$ 는 현의 길이 재매개변수화를 거친 곡선의 매개변수를 나타낸다.

이 노테이션은 딱히 미분이라는 개념이 변형돼서 나온 게 아니다. 미분기하학에서는 그냥 $s$ 로도 미분을 많이하고 $t$ 로도 미분을 많이 해야하는데, 뉴턴의 노테이션으로는 뭘로 미분하는지 구분할 수가 없고 라이프니츠의 노테이션으로는 수식이 너무 복잡하니까 둘 다의 장점을 취하기 위해 표기를 하나 더 만든 것이다.

정말 흥미로운 것은 이렇게 기하적인 관점에서 $s$ 나 $t$ 는 단지 매개변수로 쓰던 문자일 뿐이지만, 상미분방정식 중에서도 시간^time에 따른 변화를 나타내는 경우에는 그 앞글자를 따서 $t$ 에 대한 $v$ 의 도함수를 $v '$ 가 아닌 $\dot{v}$ 라 쓰게 되었다는 것이다. 이에 따라 거의 대부분의 시스템에서 시간에 따른 변화를 기술하게 되는 동역학에서는 벡터필드를 나타낼 때 $v '$ 대신 $$ \dot{v} = f(v) $$ 라는 표현을 즐겨 쓰게 되었다. 요지는 ‘무엇으로 미분하는가’를 명확하고 깔끔하게 나타내기 위한 고민 자체는 꼭 편미분이라는 틀에 얽매이지 않더라도 자연스럽게 떠오를 수 있다는 것이다.

다변수 함수의 암시

앞선 절에서는 $f '$ 와 $\dot{f}$ 가 단지 표현의 차이만으로 어떤 변수에 의해 미분되었는지 구분될 수 있고, 특히 동역학계에서는 $\dot{v} = f(v)$ 와 같은 표현에 시간 $t$ 가 등장하지 않았음에도 보편적인 컨벤션과 컨텍스트에서 이것이 시간에 대한 미분임을 암시할 수 있음을 지적했다. 이렇게 표현에 따라 암묵적^implicit으로 알 수 있는 정보에 대해서 조금 더 이야기해보려 한다.

이제 다시 편미분으로 돌아오자면, $d$ 와 $\partial$ 의 표기가 어떻게 다른지 체감하기 어려운 것은 그 수식 자체가 보여주는 편도함수에 차이가 없기 때문이다. 예를 들어 $f$ 를 $t$ 로 미분한 도함수가 $g$ 라면 그 $g$ 는 $$ g = {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} $$ 와 같이 $d$ 로 나타나든 $\partial$ 로 나타나든 크게 상관 없다. 기호야 어찌됐든 $t$ 로 미분했고 그 ‘결과’인 $g$ 가 똑같기 때문인데, 사실 $\partial$ 가 암묵적으로 주는 정보는 $g$ 가 아니라 $f$ 에 대한 것이다. 어떤 함수 $h$ 가 $H$ 에 대해 $x$ 로 미분한 결과라고 할 때, 다음과 같이 두 표현을 비교해보자:

편미분 표현을 쓰지 않을 때: $\displaystyle h = {{ d H } \over { d x }} \implies$ $H$ 를 미분하면 $h$ 인가보다.
편미분 표현을 쓸 때: $\displaystyle h = {{ \partial H } \over { \partial x }} \implies$ 왜 얘 혼자지? 어떤 $y$ 가 있어서 $H = H (x , y)$ 일텐데?

다시 말해, $\partial$ 이라고 하는 기호는 그 자체로 주어진 함수가 다변수 함수라 암시하고 있다. 생각해보면 많은 경우에 편미분을 가장 처음 제대로 접하게 되는 건 보통 편미분방정식인데, $$ {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} $$ 와 같은 방정식이 있다면 우리는 $u$ 를 $t$ 로 미분한 편도함수 $u_{t}$ 가 궁금한 것도 아니고, $u$ 를 $x$ 로 두 번 미분한 이계 편도함수 $u_{xx}$ 가 궁금한 것도 아니고, 그 둘이 같을 때 $t$ 와 $x$ 의 함수인 $u = u (t,x)$ 가 무엇인지 궁금한 것이다. 이러한 측면에서, 편미분에 쓰이는 $\partial$ 가 편미분방정식의 기술에 사용되는 것은 타당하고 자연스럽다고 주장할 수 있겠다.

한편으로는 이런 컨벤션이 널리 인정받음에 따라 $d$ 자체의 의미도 달라진다. 다변수 함수도 아닌 함수를 굳이 $\partial$ 로 미분하는 건 의미가 없으므로, 도함수의 표현에 $d$ 가 쓰였다면 그건 다변수 함수가 아니라는 암시가 되기도 한다. 예를 들어 이변수함수 $u = u (t,x)$ 에 대해 위치를 한 점으로 픽스해서 $u = u \left( t , x_{0} \right)$ 로 둔다면 $$ \left. {{ \partial u } \over { \partial t }} \right|_{x = x_{0} } = {{ d u } \over { d t }} = \dot{u} $$ 과 같은 수식은 $\partial$ 과 $d$ 의 암묵적인 정보 전달을 아주 잘 활용하고 있는 것이다. 이는 단순히 표현의 차이에서 끝나지 않고 실제로 식을 다루는 사고방식에도 영향을 미쳐서, 편미분방정식의 문제를 상대적으로 간단한 상미분방정식으로 고쳐서 푼다든가 하는 아이디어로 이어질 수도 있다.

✅ 전미분에서의 혼동을 피하기 위해

$$ df = \frac{ \partial f}{ \partial x_{1} }dx_{1} + \frac{ \partial f}{ \partial x_{2} }dx_{2} + \cdots + \frac{ \partial f}{ \partial x_{n} }dx_{n} $$ 다변수 함수 $f : \mathbb{R}^{n} \to \mathbb{R}$ 에 대해 수리물리와 같은 곳에서 쓰이는 전미분은 흔히 위와 같은 꼴로 나타내고, 조금 더 직관적으로 쓰기 위해 $n = 3$ 일 때 다음과 같이 $t,x,y,z$ 만 쓰고, $x,y,z$ 는 서로 독립이라고 하자. $$ df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz $$ 언뜻 이러한 표현은 $d$ 와 $\partial$ 이 섞여있어서 복잡해보이지만, 라이프니츠의 유산대로 ‘양변을 $dt$ 나 $dx$ 로 나누는’ 듯한 조작을 취해보면 $$ \begin{align*} df =& {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \\ {{ d f } \over { d t }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d t }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d t }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d t }} \\ {{ d f } \over { d x }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d x }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d x }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d x }} = {{ \partial f } \over { \partial x }} \end{align*} $$ 처럼 $f$ 를 $t$ 로 미분하는 의미와 $x$ 로 편미분하는 의미가 동시에 잘 표현되는 것을 확인할 수 있다. 이는 전미분의 꼴이 수식적으로 다루는 데에 있어서 무척 유용하다는 걸 보여주는데, 전미분에서 $\partial$ 을 싹 없애고 $d$ 로 통일해 다시 적어보면 다음과 같다. $$ df = {{ d f } \over { d x }} dx + {{ d f } \over { d y }} dy + {{ d f } \over { d z }} dz $$ 물론 라이프니츠의 미분 표기가 분수의 분자 분모를 다룰 때처럼 기가 막히게 직관적인 것도 맞지만, 이 글을 보고 있는 여러분이라면 $dx$ 나 $dy$, $dz$ 를 정말 그렇게 함부로 다루면 안 된다는 사실을 알고 있을 것이다. 그럼에도 불구하고, 여러분 내면의 본능은 이렇게 약분 하라고 아우성칠 것이다. $$ \begin{align*} df =& {{ d f } \over { dx }} dx + {{ d f } \over { dy }} dy + {{ d f } \over { dz }} dz \\ \overset{?}{=} & {{ d f } \over { \cancel{dx} }} \cancel{dx} + {{ d f } \over { \cancel{dy} }} \cancel{dy} + {{ d f } \over { \cancel{dz} }} \cancel{dz} \\ =& df + df + df \\ \overset{???}{=}& 3 df \end{align*} $$ 이러한 참사는 $d$ 가 $\partial$ 와 같아지는 조건이 무엇인지 간과한 탓에 벌어진 순환논증이라 볼 수 있다. 아무렇지도 않게 ‘$\partial$ 를 싹 없애고 $d$ 로 통일해 다시 적어보면’이라고 가정하는 전개가 너무 과감한 것인데, 애초에 $\partial$ 를 $d$ 로 대체해도 되겠다는 생각 자체가 $x,y,z$ 가 독립 일 때 $$ df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \implies {{ d f } \over { d x }} = {{ \partial f } \over { \partial x }} \implies d \equiv \partial $$ 에서 나온 것이다. 그러면서 $d \equiv \partial$ 의 근거가 되는 $df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz$ 를 함부로 건들면 당연히 어떤 방식으로든 탈이 난다. $d$ 와 $\partial$ 가 같으려면 예시에서 가정한 것처럼 다변수 함수의 변수들끼리 독립이든, 무슨 특수한 조건의 어떤 신기한 정리를 통해서든 $d$ 와 $\partial$ 가 정말로 같아야한다.

지금까지의 고찰에서, 편미분에 $d$ 대신 $\partial$ 를 쓰는 이유는 이들이 실제로 다르기 때문이라고 요약할 수 있다. 그동안 우리가 봐왔던, $d$ 와 $\partial$ 가 같았던 모든 예들은 반드시 그를 위한 가정을 암묵적으로 내포한다. 그 좋은 가정들 속에서 $\partial$ 가 사실상 $d$ 와 같아지기는 하겠지만, 그렇다고 굳이 $\partial$ 을 $d$ 로 다시 고쳐 써야할 이유도 없는 것이다.

❌ 미분하는 변수 외에는 상수로 취급해서?

결론부터 말하자면 틀린 대답이다.

더 정확히 말해, 현상을 설명하는 인과관계가 뒤집혀 있다. 예를 들어 $f(t,x) = \left( t^{2} + x^{2} \right)$ 이라면 $\partial t$ 는 형식적으로^formally $t$ 외의 변수를 상수로 두기 때문에 $$ {{ \partial f } \over { \partial t }} = 2t + 0 = 2t = {{ d f } \over { d t }} $$ 인 게 아니라, 이전 절에서 보았듯 $t$ 와 $x$ 가 독립이라는 가정 $\displaystyle {{ dx } \over { dt }} = 0$ 하에서 $$ \begin{align*} & df = {{ \partial f } \over { \partial t }} dt + {{ \partial f } \over { \partial x }} dx \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} {{ dt } \over { dt }} + {{ \partial f } \over { \partial x }} {{ dx } \over { dt }} \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \cdot 1 + {{ \partial f } \over { \partial x }} \cdot 0 \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \end{align*} $$ 이 성립한다. 편미분 $\partial$ 자체가 $\displaystyle {{ dx } \over { dt }} = 0$ 이라는 결과를 만들어준 게 아니라, $\displaystyle {{ dx } \over { dt }} = 0$ 이라는 원인이 $\partial \equiv d$ 이라는 결과를 만들어준 것이다. 이처럼 ‘편미분은 미분하는 변수 외에는 상수로 둔다’는 설명은 마치 상미분 $d$ 와 달리 편미분 $\partial$ 가 더 강력한 오퍼레이터라는 느낌과 오개념을 준다. 또한 $x$를 상수 취급했다면 $t$로 미분하고 나서는 사라져야하지만, 간단히 $f(t,x) = t^{2} + x^{2} + 2tx$ 정도만 생각해봐도 $\dfrac{\partial f}{\partial t}$는 여전히 변수가 $(t,x)$인 이변수함수이다.

이런 낭설이 사라지지 않는 이유는 이게 꽤 그럴싸하기 때문이다. 실전적으로는 변수끼리 $x = x(t)$ 와 같이 관계가 있는 걸 가정할 땐 애초에 $t$ 로 편미분한다는 표현 자체를 쓸 필요가 없는데, 체인룰에 따르면 $$ \begin{align*} {{ d f } \over { d t }} =& {{ d } \over { d t }} \left( t^{2} + x^{2} \right) \\ =& 2t + {{ d x^{2} } \over { d x }} {{ dx } \over { dt }} \\ =& 2t + 2x \dot{x} \end{align*} $$ 처럼 처음부터 오해의 여지 없이 수식을 전개할 수 있다. 적어도 이 예시에서 $f = f(t,x)$ 는 사실상 $f = f(t)$ 와 같이 일변수함수나 다를 바가 없거나 오히려 너무 어렵고, 결국 교과서엔 이렇게 무의미한 경우들을 다 배제해서 깔끔하게 변수들끼리 독립이면서 여전히 다변수 함수인 꼴만 남는다. 보통은 깔끔한 예시만 보면서 공부하고, 시간이 지나고, 편미분에 익숙해지고, 잘못된 직관이 자리잡고, 남들도 그렇다. 그래도 아닌 건 아닌 것이다. 단지 미분의 기호를 다르게 쓰는 것만으로 주어진 함수의 종속관계를 마음대로 바꿀 수는 없다.

https://math.stackexchange.com/a/2000353/459895 ↩︎