logo

편미분의 기호를 다르게 쓰는 이유 📂다변수벡터해석

편미분의 기호를 다르게 쓰는 이유

질문

편도함수에는 보통의 미분과 달리 dfdt\displaystyle {{ d f } \over { d t }} 대신 ft\displaystyle {{ \partial f } \over { \partial t }} 과 같은 표현을 사용한다. \partial 은 [라운드-디]round dee 혹은 [파셜]partial이라 읽으며, 역사적으로도 dd 를 굴려 쓴 [컬리-디]curly dee로 유래했다1. TeX\TeX 코드로는 \partial이고, 한국에서는 [라운드-디]조차 길다고 생각하는지 그냥 [라운드]라 읽는 사람도 많다.

dd\partial 로 쓰는가?

문제는 편미분이라는 게 그냥 다른 변수에 대해서 미분할 뿐인데 굳이 기호를 다르게 쓰는 이유를 납득하기 어렵다는 것이다. 학부 수업 수준이라면 편미분이 처음 등장할 때마다 반드시 나오는 질문이나, 막상 대답은 수학과가 아니라면 “그런 건 수학과나 고민하는 것이다” 혹은 수학과라고 해도 “그냥 노테이션의 차이로 받아들여도 무방하다” 정도로 돌아올 수 있다. 이게 딱히 틀린 말도 아닌 게, dd 로 쓰든 \partial 로 쓰든 수학과가 아니라면 그게 딱히 중요한 것도 아니고 수학과라고 해도 수식의 의미 자체가 달라지는 게 아닌 건 사실이다. 예를 들어 열방정식을 공부한다는 맥락이라면, ut=ux2 {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} \partial 을 상미분 표현 dd 로 바꿔서 dudt=dudx2 {{ d u } \over { d t }} = {{ d u } \over { d x^{2} }} 로 적었을 때 두 방정식이 같냐고 물어볼 수 있을 것이다. 매우 혼란스럽게도 그 대답은 ‘실제로 같다’기 때문에, 이쯤에서 많은 학생들이 dd\partial 의 구분에 의미가 없다고 느끼거나 정의 수준으로 받아들이고 넘어가게 된다.

답변

뉴턴과 라이프니츠

본격적인 편미분 이야기에 앞서, 재미있는 읽을거리로써 미분의 두 아버지인 뉴턴Newton과 라이프니츠Leibniz의 이야기를 꺼내려 한다. 현대에 와서 두 사람은 서로 독자적으로 미분의 개념 및 표기를 고안했다고 인정 받는데, 함수 y=f(x)y = f(x) 에 대해 그 도함수를 나타낼 때 뉴턴은 y=f(x) y ' = f ' (x) 와 같은 표기를 사용했고 라이프니츠는 dydx=df(x)dx {{ dy } \over { dx }} = {{ d f(x) } \over { dx }} 와 같은 표기를 사용했다. 같은 미분임에도 이렇게 표현의 차이가 나는 것은 이들의 사고방식과 미적분을 바라보는 관점 자체가 달랐기 때문인데, 지금 보면 동시대에 독자적으로 미분을 고안한 사람이 한 명 더 있었어도 좋았겠다 싶을 정도로 다행스러운 일이다. 뉴턴고전역학의 거장으로써 ‘위치를 한 번 미분하면 속도, 두 번 미분하면 가속도’와 같은 이야기를 많이 할 수 밖에 없었고 이 때 v=xa=v=x \begin{align*} v =& x ' \\ a =& v ' = x '' \end{align*} 같은 표현은 매우 깔끔하고 효율적이다. 라이프니츠는 기하적geometric으로 봤을 때 더 일리가 있는데, 직선의 기울기가 가로 세로의 변화량의 비로써 정의되니까 곡선에서는 아주 작은 단위를 주어 ΔyΔxdydx {{ \Delta y } \over { \Delta x }} \approx {{ d y } \over { d x }} 와 같이 접선의 기울기에 자연스럽게 접근할 수 있다. 재미있는 건 지금까지 말한 게 상미분ordinary differential임에도 분야에 따라서는 다음과 같은 노테이션의 분화가 일어나며, 뉴턴과 라이프니츠의 노테이션이 양립할 수 있다는 사실이다.

미분기하에서 ss 에 대한 미분과 tt 에 대한 미분의 표기: dfds=fanddfdt=f˙ {{ df } \over { ds }} = f^{\prime} \quad \text{and} \quad {{ df } \over { dt }} = \dot{f} ˙\dot{} 이나 프라임 ' 이나 똑같이 미분은 미분인데, 미분 기하학의 맥락에서는 위와 같이 기호를 구분할 수 있다. 보통 ss 는 단위 스피드 곡선의 매개변수고 t=t(s)t = t(s) 는 현의 길이 재매개변수화를 거친 곡선의 매개변수를 나타낸다.

이 노테이션은 딱히 미분이라는 개념이 변형돼서 나온 게 아니다. 미분기하학에서는 그냥 ss 로도 미분을 많이하고 tt 로도 미분을 많이 해야하는데, 뉴턴의 노테이션으로는 뭘로 미분하는지 구분할 수가 없고 라이프니츠의 노테이션으로는 수식이 너무 복잡하니까 둘 다의 장점을 취하기 위해 표기를 하나 더 만든 것이다.

정말 흥미로운 것은 이렇게 기하적인 관점에서 sstt 는 단지 매개변수로 쓰던 문자일 뿐이지만, 상미분방정식 중에서도 시간time에 따른 변화를 나타내는 경우에는 그 앞글자를 따서 tt 에 대한 vv 의 도함수를 vv ' 가 아닌 v˙\dot{v} 라 쓰게 되었다는 것이다. 이에 따라 거의 대부분의 시스템에서 시간에 따른 변화를 기술하게 되는 동역학에서는 벡터필드를 나타낼 때 vv ' 대신 v˙=f(v) \dot{v} = f(v) 라는 표현을 즐겨 쓰게 되었다. 요지는 ‘무엇으로 미분하는가’를 명확하고 깔끔하게 나타내기 위한 고민 자체는 꼭 편미분이라는 틀에 얽매이지 않더라도 자연스럽게 떠오를 수 있다는 것이다.

다변수 함수의 암시

앞선 절에서는 ff 'f˙\dot{f} 가 단지 표현의 차이만으로 어떤 변수에 의해 미분되었는지 구분될 수 있고, 특히 동역학계에서는 v˙=f(v)\dot{v} = f(v) 와 같은 표현에 시간 tt 가 등장하지 않았음에도 보편적인 컨벤션과 컨텍스트에서 이것이 시간에 대한 미분임을 암시할 수 있음을 지적했다. 이렇게 표현에 따라 암묵적implicit으로 알 수 있는 정보에 대해서 조금 더 이야기해보려 한다.

이제 다시 편미분으로 돌아오자면, dd\partial 의 표기가 어떻게 다른지 체감하기 어려운 것은 그 수식 자체가 보여주는 편도함수에 차이가 없기 때문이다. 예를 들어 fftt 로 미분한 도함수가 gg 라면 그 ggg=dfdt=ft g = {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} 와 같이 dd 로 나타나든 \partial 로 나타나든 크게 상관 없다. 기호야 어찌됐든 tt 로 미분했고 그 ‘결과’인 gg 가 똑같기 때문인데, 사실 \partial 가 암묵적으로 주는 정보는 gg 가 아니라 ff 에 대한 것이다. 어떤 함수 hhHH 에 대해 xx 로 미분한 결과라고 할 때, 다음과 같이 두 표현을 비교해보자:

편미분 표현을 쓰지 않을 때: h=dHdx    \displaystyle h = {{ d H } \over { d x }} \implies HH 를 미분하면 hh 인가보다.
편미분 표현을 쓸 때: h=Hx    \displaystyle h = {{ \partial H } \over { \partial x }} \implies 왜 얘 혼자지? 어떤 yy 가 있어서 H=H(x,y)H = H (x , y) 일텐데?

다시 말해, \partial 이라고 하는 기호는 그 자체로 주어진 함수가 다변수 함수라 암시하고 있다. 생각해보면 많은 경우에 편미분을 가장 처음 제대로 접하게 되는 건 보통 편미분방정식인데, ut=ux2 {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} 와 같은 방정식이 있다면 우리는 uutt 로 미분한 편도함수 utu_{t} 가 궁금한 것도 아니고, uuxx 로 두 번 미분한 이계 편도함수 uxxu_{xx} 가 궁금한 것도 아니고, 그 둘이 같을 때 ttxx 의 함수인 u=u(t,x)u = u (t,x) 가 무엇인지 궁금한 것이다. 이러한 측면에서, 편미분에 쓰이는 \partial 가 편미분방정식의 기술에 사용되는 것은 타당하고 자연스럽다고 주장할 수 있겠다.

한편으로는 이런 컨벤션이 널리 인정받음에 따라 dd 자체의 의미도 달라진다. 다변수 함수도 아닌 함수를 굳이 \partial 로 미분하는 건 의미가 없으므로, 도함수의 표현에 dd 가 쓰였다면 그건 다변수 함수가 아니라는 암시가 되기도 한다. 예를 들어 이변수함수 u=u(t,x)u = u (t,x) 에 대해 위치를 한 점으로 픽스해서 u=u(t,x0)u = u \left( t , x_{0} \right) 로 둔다면 utx=x0=dudt=u˙ \left. {{ \partial u } \over { \partial t }} \right|_{x = x_{0} } = {{ d u } \over { d t }} = \dot{u} 과 같은 수식은 \partialdd 의 암묵적인 정보 전달을 아주 잘 활용하고 있는 것이다. 이는 단순히 표현의 차이에서 끝나지 않고 실제로 식을 다루는 사고방식에도 영향을 미쳐서, 편미분방정식의 문제를 상대적으로 간단한 상미분방정식으로 고쳐서 푼다든가 하는 아이디어로 이어질 수도 있다.

✅ 전미분에서의 혼동을 피하기 위해

df=fx1dx1+fx2dx2++fxndxn df = \frac{ \partial f}{ \partial x_{1} }dx_{1} + \frac{ \partial f}{ \partial x_{2} }dx_{2} + \cdots + \frac{ \partial f}{ \partial x_{n} }dx_{n} 다변수 함수 f:RnRf : \mathbb{R}^{n} \to \mathbb{R} 에 대해 수리물리와 같은 곳에서 쓰이는 전미분은 흔히 위와 같은 꼴로 나타내고, 조금 더 직관적으로 쓰기 위해 n=3n = 3 일 때 다음과 같이 t,x,y,zt,x,y,z 만 쓰고, x,y,zx,y,z 는 서로 독립이라고 하자. df=fxdx+fydy+fzdz df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz 언뜻 이러한 표현은 dd\partial 이 섞여있어서 복잡해보이지만, 라이프니츠의 유산대로 ‘양변을 dtdtdxdx 로 나누는’ 듯한 조작을 취해보면 df=fxdx+fydy+fzdzdfdt=fxdxdt+fydydt+fzdzdtdfdx=fxdxdx+fydydx+fzdzdx=fx \begin{align*} df =& {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \\ {{ d f } \over { d t }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d t }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d t }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d t }} \\ {{ d f } \over { d x }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d x }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d x }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d x }} = {{ \partial f } \over { \partial x }} \end{align*} 처럼 fftt 로 미분하는 의미와 xx 로 편미분하는 의미가 동시에 잘 표현되는 것을 확인할 수 있다. 이는 전미분의 꼴이 수식적으로 다루는 데에 있어서 무척 유용하다는 걸 보여주는데, 전미분에서 \partial 을 싹 없애고 dd 로 통일해 다시 적어보면 다음과 같다. df=dfdxdx+dfdydy+dfdzdz df = {{ d f } \over { d x }} dx + {{ d f } \over { d y }} dy + {{ d f } \over { d z }} dz 물론 라이프니츠의 미분 표기가 분수의 분자 분모를 다룰 때처럼 기가 막히게 직관적인 것도 맞지만, 이 글을 보고 있는 여러분이라면 dxdxdydy, dzdz 를 정말 그렇게 함부로 다루면 안 된다는 사실을 알고 있을 것이다. 그럼에도 불구하고, 여러분 내면의 본능은 이렇게 약분 하라고 아우성칠 것이다. df=dfdxdx+dfdydy+dfdzdz=?dfdxdx+dfdydy+dfdzdz=df+df+df=???3df \begin{align*} df =& {{ d f } \over { dx }} dx + {{ d f } \over { dy }} dy + {{ d f } \over { dz }} dz \\ \overset{?}{=} & {{ d f } \over { \cancel{dx} }} \cancel{dx} + {{ d f } \over { \cancel{dy} }} \cancel{dy} + {{ d f } \over { \cancel{dz} }} \cancel{dz} \\ =& df + df + df \\ \overset{???}{=}& 3 df \end{align*} 이러한 참사는 dd\partial 와 같아지는 조건이 무엇인지 간과한 탓에 벌어진 순환논증이라 볼 수 있다. 아무렇지도 않게 ‘\partial 를 싹 없애고 dd 로 통일해 다시 적어보면’이라고 가정하는 전개가 너무 과감한 것인데, 애초에 \partialdd 로 대체해도 되겠다는 생각 자체가 x,y,zx,y,z 가 독립 일 때 df=fxdx+fydy+fzdz    dfdx=fx    d df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \implies {{ d f } \over { d x }} = {{ \partial f } \over { \partial x }} \implies d \equiv \partial 에서 나온 것이다. 그러면서 dd \equiv \partial 의 근거가 되는 df=fxdx+fydy+fzdzdf = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz 를 함부로 건들면 당연히 어떤 방식으로든 탈이 난다. dd\partial 가 같으려면 예시에서 가정한 것처럼 다변수 함수의 변수들끼리 독립이든, 무슨 특수한 조건의 어떤 신기한 정리를 통해서든 dd\partial 가 정말로 같아야한다.

지금까지의 고찰에서, 편미분에 dd 대신 \partial 를 쓰는 이유는 이들이 실제로 다르기 때문이라고 요약할 수 있다. 그동안 우리가 봐왔던, dd\partial 가 같았던 모든 예들은 반드시 그를 위한 가정을 암묵적으로 내포한다. 그 좋은 가정들 속에서 \partial 가 사실상 dd 와 같아지기는 하겠지만, 그렇다고 굳이 \partialdd 로 다시 고쳐 써야할 이유도 없는 것이다.

❌ 미분하는 변수 외에는 상수로 취급해서?

결론부터 말하자면 틀린 대답이다.

더 정확히 말해, 현상을 설명하는 인과관계가 뒤집혀 있다. 예를 들어 f(t,x)=(t2+x2)f(t,x) = \left( t^{2} + x^{2} \right) 이라면 t\partial t 는 형식적으로formally tt 외의 변수를 상수로 두기 때문에 ft=2t+0=2t=dfdt {{ \partial f } \over { \partial t }} = 2t + 0 = 2t = {{ d f } \over { d t }} 인 게 아니라, 이전 절에서 보았듯 ttxx 가 독립이라는 가정 dxdt=0\displaystyle {{ dx } \over { dt }} = 0 하에서 df=ftdt+fxdx    dfdt=ftdtdt+fxdxdt    dfdt=ft1+fx0    dfdt=ft \begin{align*} & df = {{ \partial f } \over { \partial t }} dt + {{ \partial f } \over { \partial x }} dx \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} {{ dt } \over { dt }} + {{ \partial f } \over { \partial x }} {{ dx } \over { dt }} \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \cdot 1 + {{ \partial f } \over { \partial x }} \cdot 0 \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \end{align*} 이 성립한다. 편미분 \partial 자체가 dxdt=0\displaystyle {{ dx } \over { dt }} = 0 이라는 결과를 만들어준 게 아니라, dxdt=0\displaystyle {{ dx } \over { dt }} = 0 이라는 원인이 d\partial \equiv d 이라는 결과를 만들어준 것이다. 이처럼 ‘편미분은 미분하는 변수 외에는 상수로 둔다’는 설명은 마치 상미분 dd 와 달리 편미분 \partial 가 더 강력한 오퍼레이터라는 느낌과 오개념을 준다. 또한 xx를 상수 취급했다면 tt로 미분하고 나서는 사라져야하지만, 간단히 f(t,x)=t2+x2+2txf(t,x) = t^{2} + x^{2} + 2tx 정도만 생각해봐도 ft\dfrac{\partial f}{\partial t}는 여전히 변수가 (t,x)(t,x)인 이변수함수이다.

이런 낭설이 사라지지 않는 이유는 이게 꽤 그럴싸하기 때문이다. 실전적으로는 변수끼리 x=x(t)x = x(t) 와 같이 관계가 있는 걸 가정할 땐 애초에 tt 로 편미분한다는 표현 자체를 쓸 필요가 없는데, 체인룰에 따르면 dfdt=ddt(t2+x2)=2t+dx2dxdxdt=2t+2xx˙ \begin{align*} {{ d f } \over { d t }} =& {{ d } \over { d t }} \left( t^{2} + x^{2} \right) \\ =& 2t + {{ d x^{2} } \over { d x }} {{ dx } \over { dt }} \\ =& 2t + 2x \dot{x} \end{align*} 처럼 처음부터 오해의 여지 없이 수식을 전개할 수 있다. 적어도 이 예시에서 f=f(t,x)f = f(t,x) 는 사실상 f=f(t)f = f(t) 와 같이 일변수함수나 다를 바가 없거나 오히려 너무 어렵고, 결국 교과서엔 이렇게 무의미한 경우들을 다 배제해서 깔끔하게 변수들끼리 독립이면서 여전히 다변수 함수인 꼴만 남는다. 보통은 깔끔한 예시만 보면서 공부하고, 시간이 지나고, 편미분에 익숙해지고, 잘못된 직관이 자리잡고, 남들도 그렇다. 그래도 아닌 건 아닌 것이다. 단지 미분의 기호를 다르게 쓰는 것만으로 주어진 함수의 종속관계를 마음대로 바꿀 수는 없다.