편도함수에는 보통의 미분과 달리 dtdf 대신 ∂t∂f 과 같은 표현을 사용한다. ∂ 은 [라운드-디]round dee 혹은 [파셜]partial이라 읽으며, 역사적으로도 d 를 굴려 쓴 [컬리-디]curly dee로 유래했다1. TEX 코드로는 \partial이고, 한국에서는 [라운드-디]조차 길다고 생각하는지 그냥 [라운드]라 읽는 사람도 많다.
왜 d 를 ∂ 로 쓰는가?
문제는 편미분이라는 게 그냥 다른 변수에 대해서 미분할 뿐인데 굳이 기호를 다르게 쓰는 이유를 납득하기 어렵다는 것이다. 학부 수업 수준이라면 편미분이 처음 등장할 때마다 반드시 나오는 질문이나, 막상 대답은 수학과가 아니라면 “그런 건 수학과나 고민하는 것이다” 혹은 수학과라고 해도 “그냥 노테이션의 차이로 받아들여도 무방하다” 정도로 돌아올 수 있다. 이게 딱히 틀린 말도 아닌 게, d 로 쓰든 ∂ 로 쓰든 수학과가 아니라면 그게 딱히 중요한 것도 아니고 수학과라고 해도 수식의 의미 자체가 달라지는 게 아닌 건 사실이다.
예를 들어 열방정식을 공부한다는 맥락이라면,
∂t∂u=∂x2∂u
의 ∂ 을 상미분 표현 d 로 바꿔서
dtdu=dx2du
로 적었을 때 두 방정식이 같냐고 물어볼 수 있을 것이다. 매우 혼란스럽게도 그 대답은 ‘실제로 같다’기 때문에, 이쯤에서 많은 학생들이 d 와 ∂ 의 구분에 의미가 없다고 느끼거나 정의 수준으로 받아들이고 넘어가게 된다.
답변
뉴턴과 라이프니츠
본격적인 편미분 이야기에 앞서, 재미있는 읽을거리로써 미분의 두 아버지인 뉴턴Newton과 라이프니츠Leibniz의 이야기를 꺼내려 한다. 현대에 와서 두 사람은 서로 독자적으로 미분의 개념 및 표기를 고안했다고 인정 받는데, 함수y=f(x) 에 대해 그 도함수를 나타낼 때 뉴턴은
y′=f′(x)
와 같은 표기를 사용했고 라이프니츠는
dxdy=dxdf(x)
와 같은 표기를 사용했다. 같은 미분임에도 이렇게 표현의 차이가 나는 것은 이들의 사고방식과 미적분을 바라보는 관점 자체가 달랐기 때문인데, 지금 보면 동시대에 독자적으로 미분을 고안한 사람이 한 명 더 있었어도 좋았겠다 싶을 정도로 다행스러운 일이다. 뉴턴은 고전역학의 거장으로써 ‘위치를 한 번 미분하면 속도, 두 번 미분하면 가속도’와 같은 이야기를 많이 할 수 밖에 없었고 이 때
v=a=x′v′=x′′
같은 표현은 매우 깔끔하고 효율적이다. 라이프니츠는 기하적geometric으로 봤을 때 더 일리가 있는데, 직선의 기울기가 가로 세로의 변화량의 비로써 정의되니까 곡선에서는 아주 작은 단위를 주어
ΔxΔy≈dxdy
와 같이 접선의 기울기에 자연스럽게 접근할 수 있다. 재미있는 건 지금까지 말한 게 상미분ordinary differential임에도 분야에 따라서는 다음과 같은 노테이션의 분화가 일어나며, 뉴턴과 라이프니츠의 노테이션이 양립할 수 있다는 사실이다.
미분기하에서 s 에 대한 미분과 t 에 대한 미분의 표기:
dsdf=f′anddtdf=f˙
닷 ˙ 이나 프라임 ′ 이나 똑같이 미분은 미분인데, 미분 기하학의 맥락에서는 위와 같이 기호를 구분할 수 있다. 보통 s 는 단위 스피드 곡선의 매개변수고 t=t(s) 는 현의 길이 재매개변수화를 거친 곡선의 매개변수를 나타낸다.
이 노테이션은 딱히 미분이라는 개념이 변형돼서 나온 게 아니다. 미분기하학에서는 그냥 s 로도 미분을 많이하고 t 로도 미분을 많이 해야하는데, 뉴턴의 노테이션으로는 뭘로 미분하는지 구분할 수가 없고 라이프니츠의 노테이션으로는 수식이 너무 복잡하니까 둘 다의 장점을 취하기 위해 표기를 하나 더 만든 것이다.
정말 흥미로운 것은 이렇게 기하적인 관점에서 s 나 t 는 단지 매개변수로 쓰던 문자일 뿐이지만, 상미분방정식 중에서도 시간time에 따른 변화를 나타내는 경우에는 그 앞글자를 따서 t 에 대한 v 의 도함수를 v′ 가 아닌 v˙ 라 쓰게 되었다는 것이다. 이에 따라 거의 대부분의 시스템에서 시간에 따른 변화를 기술하게 되는 동역학에서는 벡터필드를 나타낼 때 v′ 대신
v˙=f(v)
라는 표현을 즐겨 쓰게 되었다. 요지는 ‘무엇으로 미분하는가’를 명확하고 깔끔하게 나타내기 위한 고민 자체는 꼭 편미분이라는 틀에 얽매이지 않더라도 자연스럽게 떠오를 수 있다는 것이다.
다변수 함수의 암시
앞선 절에서는 f′ 와 f˙ 가 단지 표현의 차이만으로 어떤 변수에 의해 미분되었는지 구분될 수 있고, 특히 동역학계에서는 v˙=f(v) 와 같은 표현에 시간 t 가 등장하지 않았음에도 보편적인 컨벤션과 컨텍스트에서 이것이 시간에 대한 미분임을 암시할 수 있음을 지적했다. 이렇게 표현에 따라 암묵적implicit으로 알 수 있는 정보에 대해서 조금 더 이야기해보려 한다.
이제 다시 편미분으로 돌아오자면, d 와 ∂ 의 표기가 어떻게 다른지 체감하기 어려운 것은 그 수식 자체가 보여주는 편도함수에 차이가 없기 때문이다. 예를 들어 f 를 t 로 미분한 도함수가 g 라면 그 g 는
g=dtdf=∂t∂f
와 같이 d 로 나타나든 ∂ 로 나타나든 크게 상관 없다. 기호야 어찌됐든 t 로 미분했고 그 ‘결과’인 g 가 똑같기 때문인데, 사실 ∂ 가 암묵적으로 주는 정보는 g 가 아니라 f 에 대한 것이다. 어떤 함수 h 가 H 에 대해 x 로 미분한 결과라고 할 때, 다음과 같이 두 표현을 비교해보자:
편미분 표현을 쓰지 않을 때: h=dxdH⟹H 를 미분하면 h 인가보다. 편미분 표현을 쓸 때: h=∂x∂H⟹ 왜 얘 혼자지? 어떤 y 가 있어서 H=H(x,y) 일텐데?
다시 말해, ∂ 이라고 하는 기호는 그 자체로 주어진 함수가 다변수 함수라 암시하고 있다. 생각해보면 많은 경우에 편미분을 가장 처음 제대로 접하게 되는 건 보통 편미분방정식인데,
∂t∂u=∂x2∂u
와 같은 방정식이 있다면 우리는 u 를 t 로 미분한 편도함수 ut 가 궁금한 것도 아니고, u 를 x 로 두 번 미분한 이계 편도함수 uxx 가 궁금한 것도 아니고, 그 둘이 같을 때 t 와 x 의 함수인 u=u(t,x) 가 무엇인지 궁금한 것이다. 이러한 측면에서, 편미분에 쓰이는 ∂ 가 편미분방정식의 기술에 사용되는 것은 타당하고 자연스럽다고 주장할 수 있겠다.
한편으로는 이런 컨벤션이 널리 인정받음에 따라 d 자체의 의미도 달라진다. 다변수 함수도 아닌 함수를 굳이 ∂ 로 미분하는 건 의미가 없으므로, 도함수의 표현에 d 가 쓰였다면 그건 다변수 함수가 아니라는 암시가 되기도 한다. 예를 들어 이변수함수 u=u(t,x) 에 대해 위치를 한 점으로 픽스해서 u=u(t,x0) 로 둔다면
∂t∂ux=x0=dtdu=u˙
과 같은 수식은 ∂ 과 d 의 암묵적인 정보 전달을 아주 잘 활용하고 있는 것이다. 이는 단순히 표현의 차이에서 끝나지 않고 실제로 식을 다루는 사고방식에도 영향을 미쳐서, 편미분방정식의 문제를 상대적으로 간단한 상미분방정식으로 고쳐서 푼다든가 하는 아이디어로 이어질 수도 있다.
✅ 전미분에서의 혼동을 피하기 위해
df=∂x1∂fdx1+∂x2∂fdx2+⋯+∂xn∂fdxn
다변수 함수 f:Rn→R 에 대해 수리물리와 같은 곳에서 쓰이는 전미분은 흔히 위와 같은 꼴로 나타내고, 조금 더 직관적으로 쓰기 위해 n=3 일 때 다음과 같이 t,x,y,z 만 쓰고, x,y,z 는 서로 독립이라고 하자.
df=∂x∂fdx+∂y∂fdy+∂z∂fdz
언뜻 이러한 표현은 d 와 ∂ 이 섞여있어서 복잡해보이지만, 라이프니츠의 유산대로 ‘양변을 dt 나 dx 로 나누는’ 듯한 조작을 취해보면
df=dtdf=dxdf=∂x∂fdx+∂y∂fdy+∂z∂fdz∂x∂fdtdx+∂y∂fdtdy+∂z∂fdtdz∂x∂fdxdx+∂y∂fdxdy+∂z∂fdxdz=∂x∂f
처럼 f 를 t 로 미분하는 의미와 x 로 편미분하는 의미가 동시에 잘 표현되는 것을 확인할 수 있다. 이는 전미분의 꼴이 수식적으로 다루는 데에 있어서 무척 유용하다는 걸 보여주는데, 전미분에서 ∂ 을 싹 없애고 d 로 통일해 다시 적어보면 다음과 같다.
df=dxdfdx+dydfdy+dzdfdz
물론 라이프니츠의 미분 표기가 분수의 분자 분모를 다룰 때처럼 기가 막히게 직관적인 것도 맞지만, 이 글을 보고 있는 여러분이라면 dx 나 dy, dz 를 정말 그렇게 함부로 다루면 안 된다는 사실을 알고 있을 것이다. 그럼에도 불구하고, 여러분 내면의 본능은 이렇게 약분 하라고 아우성칠 것이다.
df==?==???dxdfdx+dydfdy+dzdfdzdxdfdx+dydfdy+dzdfdzdf+df+df3df
이러한 참사는 d 가 ∂ 와 같아지는 조건이 무엇인지 간과한 탓에 벌어진 순환논증이라 볼 수 있다. 아무렇지도 않게 ‘∂ 를 싹 없애고 d 로 통일해 다시 적어보면’이라고 가정하는 전개가 너무 과감한 것인데, 애초에 ∂ 를 d 로 대체해도 되겠다는 생각 자체가 x,y,z 가 독립 일 때
df=∂x∂fdx+∂y∂fdy+∂z∂fdz⟹dxdf=∂x∂f⟹d≡∂
에서 나온 것이다. 그러면서 d≡∂ 의 근거가 되는 df=∂x∂fdx+∂y∂fdy+∂z∂fdz 를 함부로 건들면 당연히 어떤 방식으로든 탈이 난다. d 와 ∂ 가 같으려면 예시에서 가정한 것처럼 다변수 함수의 변수들끼리 독립이든, 무슨 특수한 조건의 어떤 신기한 정리를 통해서든 d 와 ∂ 가 정말로 같아야한다.
지금까지의 고찰에서, 편미분에 d 대신 ∂ 를 쓰는 이유는 이들이 실제로 다르기 때문이라고 요약할 수 있다. 그동안 우리가 봐왔던, d 와 ∂ 가 같았던 모든 예들은 반드시 그를 위한 가정을 암묵적으로 내포한다. 그 좋은 가정들 속에서 ∂ 가 사실상 d 와 같아지기는 하겠지만, 그렇다고 굳이 ∂ 을 d 로 다시 고쳐 써야할 이유도 없는 것이다.
❌ 미분하는 변수 외에는 상수로 취급해서?
결론부터 말하자면 틀린 대답이다.
더 정확히 말해, 현상을 설명하는 인과관계가 뒤집혀 있다. 예를 들어 f(t,x)=(t2+x2) 이라면 ∂t 는 형식적으로formallyt 외의 변수를 상수로 두기 때문에
∂t∂f=2t+0=2t=dtdf
인 게 아니라, 이전 절에서 보았듯 t 와 x 가 독립이라는 가정 dtdx=0 하에서
⟹⟹⟹df=∂t∂fdt+∂x∂fdxdtdf=∂t∂fdtdt+∂x∂fdtdxdtdf=∂t∂f⋅1+∂x∂f⋅0dtdf=∂t∂f
이 성립한다. 편미분 ∂ 자체가 dtdx=0 이라는 결과를 만들어준 게 아니라, dtdx=0 이라는 원인이 ∂≡d 이라는 결과를 만들어준 것이다. 이처럼 ‘편미분은 미분하는 변수 외에는 상수로 둔다’는 설명은 마치 상미분 d 와 달리 편미분 ∂ 가 더 강력한 오퍼레이터라는 느낌과 오개념을 준다. 또한 x를 상수 취급했다면 t로 미분하고 나서는 사라져야하지만, 간단히 f(t,x)=t2+x2+2tx 정도만 생각해봐도 ∂t∂f는 여전히 변수가 (t,x)인 이변수함수이다.
이런 낭설이 사라지지 않는 이유는 이게 꽤 그럴싸하기 때문이다. 실전적으로는 변수끼리 x=x(t) 와 같이 관계가 있는 걸 가정할 땐 애초에 t 로 편미분한다는 표현 자체를 쓸 필요가 없는데, 체인룰에 따르면
dtdf===dtd(t2+x2)2t+dxdx2dtdx2t+2xx˙
처럼 처음부터 오해의 여지 없이 수식을 전개할 수 있다. 적어도 이 예시에서 f=f(t,x) 는 사실상 f=f(t) 와 같이 일변수함수나 다를 바가 없거나 오히려 너무 어렵고, 결국 교과서엔 이렇게 무의미한 경우들을 다 배제해서 깔끔하게 변수들끼리 독립이면서 여전히 다변수 함수인 꼴만 남는다. 보통은 깔끔한 예시만 보면서 공부하고, 시간이 지나고, 편미분에 익숙해지고, 잘못된 직관이 자리잡고, 남들도 그렇다. 그래도 아닌 건 아닌 것이다. 단지 미분의 기호를 다르게 쓰는 것만으로 주어진 함수의 종속관계를 마음대로 바꿀 수는 없다.