logo

偏微分の記号を使い分ける理由 📂多変数ベクトル解析

偏微分の記号を使い分ける理由

質問

偏微分では、通常の微分と異なり、dfdt\displaystyle {{ d f } \over { d t }} の代わりに ft\displaystyle {{ \partial f } \over { \partial t }} のような表現を使用します。\partial は[ラウンドディー]round Deeまたは[パーシャル]partialと読み、歴史的にもdd を丸めて書いた[カーリーディー]curly Deeから由来しています。1 TeX\TeX のコードでは \partial であり、韓国では[ラウンドディー]さえも長いと考えるのか、単に[ラウンド]と読む人も多いです。

なぜ dd\partial で書くのか?

問題は、偏微分が単に他の変数に関して微分するだけなのに、なぜ記号を異なるものにする必要があるのかということが納得できないということです。学部の授業レベルでは、偏微分が初めて登場するたびに必ず出てくる質問ですが、実際の答えは、数学科でなければ「そんなことは数学科で考えることだ」または数学科であっても「ただの表記の違いとして受け入れても問題ない」という程度で返ってくることがあります。これが決して間違っているわけではないのは、dd で書こうが \partial で書こうが、数学科でなければそれが特に重要なわけではなく、数学科であっても式の意味自体が変わるわけではないからです。 例えば、熱方程式を学ぶ場合、 ut=ux2 {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} \partial を通常の微分表記 dd に変えて dudt=dudx2 {{ d u } \over { d t }} = {{ d u } \over { d x^{2} }} と書いた場合、2つの方程式が同じかどうかを尋ねることができます。非常に混乱することに、その答えは「実際には同じ」なので、この時点で多くの学生が dd\partial の区別に意味がないと感じたり、定義レベルで受け入れてしまったりすることになります。

回答

ニュートンとライプニッツ

本格的な偏微分の話に入る前に、微分の2人の父、ニュートンNewtonとライプニッツLeibnizの話を面白い読み物として取り上げたいと思います。現代において、両者は独自に微分の概念および記法を考案したと認められていますが、関数y=f(x)y = f(x)導関数を表す際、ニュートンは y=f(x) y ' = f ' (x) のような表記を使用し、ライプニッツは dydx=df(x)dx {{ dy } \over { dx }} = {{ d f(x) } \over { dx }} のような表記を使用しました。同じ微分であっても、このように表現の違いが生じるのは、両者の思考方法や微積分に対する見方自体が異なっていたためです。現在では、同時代に独自に微分を考案した人がもう一人いても良かったと思えるほど、幸運なことです。ニュートン古典力学の巨匠として、「位置を一度微分すると速度、二度微分すると加速度」といった話をしなければならず、この時 v=xa=v=x \begin{align*} v =& x ' \\ a =& v ' = x '' \end{align*} のような表現は非常にすっきりして効率的です。ライプニッツは幾何学的geometricな観点から見るとより理にかなっており、直線の傾きが横と縦の変化量の比として定義されるため、曲線では非常に小さな単位を与えて ΔyΔxdydx {{ \Delta y } \over { \Delta x }} \approx {{ d y } \over { d x }} のように接線の傾きに自然に近づくことができます。興味深いことに、ここまで述べたのは全て通常の微分に関するものであり、分野によっては以下のような表記の分化が起こり、ニュートンとライプニッツの表記が共存することができるという事実です。

微分幾何学におけるss に対する微分とtt に対する微分の表記dfds=fanddfdt=f˙ {{ df } \over { ds }} = f^{\prime} \quad \text{and} \quad {{ df } \over { dt }} = \dot{f} ドット˙\dot{} やプライム' はどちらも微分を表していますが、微分幾何学の文脈では上記のように記号を区別することができます。通常、ss は単位速度曲線のパラメータであり、t=t(s)t = t(s) は曲線の長さの再パラメータ化によって表されます。

この表記は、微分という概念が変形されて出てきたわけではありません。微分幾何学では、単にss で多くの微分を行い、tt でも多くの微分を行う必要があるため、ニュートンの表記では何に対して微分しているのか区別できず、ライプニッツの表記では数式が複雑すぎるため、両者の長所を取り入れるために新たな表記を作成したものです。

本当に興味深いのは、このように幾何学的な観点からsstt は単なるパラメータに過ぎないにもかかわらず、常微分方程式の中でも特に時間timeによる変化を表す場合には、その頭文字を取ってtt に対するvv の導関数をvv ' ではなくv˙\dot{v} と書くようになりました。これにより、ダイナミクスなどのほとんどのシステムで時間による変化を記述する際には、vv ' の代わりに v˙=f(v) \dot{v} = f(v) という表現を好んで使用するようになりました。ポイントは、「何によって微分するか」を明確かつすっきりと表現するための検討自体が、偏微分という枠組みに縛られなくても自然に浮かぶことができるということです。

多変数関数の暗示

前節では、ff 'f˙\dot{f} が単に表現の違いだけで、どの変数によって微分されたかを区別できること、特にダイナミクスシステムでは、時間v˙=f(v)\dot{v} = f(v) が現れなくても、一般的な規約とコンテキストからそれが時間による微分であることを暗示できることを指摘しました。このように表現によって暗黙的implicitにわかる情報についてもう少し話してみたいと思います。

再び偏微分に戻ると、dd\partial の表記がどのように異なるかを実感するのが難しいのは、その式自体が示す偏導関数に違いがないからです。例えば、fftt で微分した導関数がgg である場合、そのggg=dfdt=ft g = {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} のようにdd で表されても\partial で表されてもあまり関係がない。記号がどうであれ、tt で微分された「結果」であるgg が同じだからです。しかし、\partial が暗黙的に与える情報はgg ではなくff に関するものです。ある関数hhHH に関してxx で微分された結果だとすると、次のように2つの表現を比較してみましょう:

偏微分表現を使用しない場合:h=dHdx    \displaystyle h = {{ d H } \over { d x }} \implies HH を微分するとhh になるらしい。
偏微分表現を使用する場合:h=Hx    \displaystyle h = {{ \partial H } \over { \partial x }} \implies なぜこれだけ?何かyy があってH=H(x,y)H = H (x , y) になるんだろう?

つまり、\partial という記号は、与えられた関数が多変数関数であることを暗示しているのです。多くの場合、偏微分に初めて本格的に触れるのは通常偏微分方程式であり、 ut=ux2 {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} のような方程式があれば、私たちはuutt で微分した偏導関数utu_{t} が気になるわけではなく、uuxx で2回微分した2階偏導関数uxxu_{xx} が気になるわけでもなく、その両方が等しいときのttxx の関数u=u(t,x)u = u (t,x) が何であるかが気になるのです。この観点から、偏微分に使用される\partial が偏微分方程式の記述に使用されるのは妥当で自然だと主張することができます。

一方で、このような慣習が広く受け入れられることにより、dd 自体の意味も変わります。多変数関数ではない関数をわざわざ\partial で微分することは意味がないため、導関数の表現にdd が使用されていれば、それは多変数関数ではないことを暗示することになります。例えば、2変数関数u=u(t,x)u = u (t,x) に対して位置を一点に固定してu=u(t,x0)u = u \left( t , x_{0} \right) とすると、 utx=x0=dudt=u˙ \left. {{ \partial u } \over { \partial t }} \right|_{x = x_{0} } = {{ d u } \over { d t }} = \dot{u} のような式は、\partialdd の暗黙的な情報伝達を非常にうまく活用しています。これは、単なる表現の違いにとどまらず、実際に式を扱う思考方法にも影響を与え、偏微分方程式の問題を比較的簡単な常微分方程式に変換して解くといったアイデアにつながることもあります。

✅ 全微分における混乱を避けるために

df=fx1dx1+fx2dx2++fxndxn df = \frac{ \partial f}{ \partial x_{1} }dx_{1} + \frac{ \partial f}{ \partial x_{2} }dx_{2} + \cdots + \frac{ \partial f}{ \partial x_{n} }dx_{n} 多変数関数f:RnRf : \mathbb{R}^{n} \to \mathbb{R} に対する数理物理学などで使用される全微分は、通常上記のような形で表され、もう少し直感的に書くためにn=3n = 3 のとき次のようにt,x,y,zt,x,y,z のみを書き、x,y,zx,y,z は互いに独立であるとしましょう。 df=fxdx+fydy+fzdz df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz 一見すると、dd\partial が混在していて複雑に見えますが、ライプニッツの遺産に従って「両辺をdtdtdxdx で割る」ような操作を行うと、 df=fxdx+fydy+fzdzdfdt=fxdxdt+fydydt+fzdzdtdfdx=fxdxdx+fydydx+fzdzdx=fx \begin{align*} df =& {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \\ {{ d f } \over { d t }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d t }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d t }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d t }} \\ {{ d f } \over { d x }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d x }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d x }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d x }} = {{ \partial f } \over { \partial x }} \end{align*} のようにfftt で微分する意味とxx で偏微分する意味が同時によく表現されていることがわかります。これは全微分の形が数式的に扱う上で非常に便利であることを示していますが、全微分で\partial をすべて取り除いてdd で統一して再度書き直すと次のようになります。 df=dfdxdx+dfdydy+dfdzdz df = {{ d f } \over { d x }} dx + {{ d f } \over { d y }} dy + {{ d f } \over { d z }} dz もちろん、ライプニッツの微分記法が分数の分子と分母を扱うときのように非常に直感的であることは事実ですが、この記事を読んでいる皆さんであれば、dxdxdydydzdz を本当にそのように扱ってはいけないことを知っているでしょう。それにもかかわらず、皆さんの内なる本能はこのように約分するように叫ぶでしょう。 df=dfdxdx+dfdydy+dfdzdz=?dfdxdx+dfdydy+dfdzdz=df+df+df=???3df \begin{align*} df =& {{ d f } \over { dx }} dx + {{ d f } \over { dy }} dy + {{ d f } \over { dz }} dz \\ \overset{?}{=} & {{ d f } \over { \cancel{dx} }} \cancel{dx} + {{ d f } \over { \cancel{dy} }} \cancel{dy} + {{ d f } \over { \cancel{dz} }} \cancel{dz} \\ =& df + df + df \\ \overset{???}{=}& 3 df \end{align*} このような惨事は、dd\partial と同じになる条件を見落としたために起こった循環論法と見ることができます。’\partial をすべて取り除いてdd で統一して再度書き直す’という展開を無造作に行うことがあまりにも大胆であるため、何らかの方法で\partialdd で置き換えてもよいと考えること自体が、x,y,zx,y,z が独立である場合 df=fxdx+fydy+fzdz    dfdx=fx    d df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \implies {{ d f } \over { d x }} = {{ \partial f } \over { \partial x }} \implies d \equiv \partial から出てきたものです。その一方で、dd \equiv \partial の根拠となるdf=fxdx+fydy+fzdzdf = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz を無闇にいじると、どのような方法でも必ず問題が発生します。dd\partial が等しくなるには、例で仮定したように多変数関数の変数が互いに独立である場合や、何らかの特別な条件の下での何らかの驚くべき定理を通じて、dd\partial が本当に同じである必要があります。

これまでの考察から、偏微分でdd の代わりに\partial を使用する理由は、実際にそれらが異なるためであると要約することができます。これまで見てきた、dd\partial が同じだったすべての例は、必ずそのための仮定を暗黙的に含んでいます。その良い仮定の中で、\partial が実質的にdd と同じになるかもしれませんが、だからといってわざわざ\partialdd で書き直す必要もないのです。

❌ 微分する変数以外は定数とみなすために?

結論から言うと、間違った答えです。

もっと正確に言うと、現象を説明する因果関係が逆転しています。例えば、f(t,x)=(t2+x2)f(t,x) = \left( t^{2} + x^{2} \right) であれば、形式的にformallyt\partial t 以外の変数を定数として ft=2t+0=2t=dfdt {{ \partial f } \over { \partial t }} = 2t + 0 = 2t = {{ d f } \over { d t }} ではないのは、前節で見たように、tttt が独立であるという仮定xx の下で df=ftdt+fxdx    dfdt=ftdtdt+fxdxdt    dfdt=ft1+fx0    dfdt=ft \begin{align*} & df = {{ \partial f } \over { \partial t }} dt + {{ \partial f } \over { \partial x }} dx \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} {{ dt } \over { dt }} + {{ \partial f } \over { \partial x }} {{ dx } \over { dt }} \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \cdot 1 + {{ \partial f } \over { \partial x }} \cdot 0 \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \end{align*} が成立するからです。偏微分dxdt=0\displaystyle {{ dx } \over { dt }} = 0 自体が\partial という結果をもたらしたのではなく、dxdt=0\displaystyle {{ dx } \over { dt }} = 0 という原因がdxdt=0\displaystyle {{ dx } \over { dt }} = 0 という結果をもたらしたのです。このように「偏微分は微分する変数以外を定数として扱う」という説明は、まるで通常の微分d\partial \equiv d と異なり、偏微分dd がより強力なオペレーターであるかのような印象と誤解を与えます。また、\partial を定数として扱った場合、xx で微分した後には消えるはずですが、単純にtt のような例を考えると、f(t,x)=t2+x2+2txf(t,x) = t^{2} + x^{2} + 2tx は依然として変数がft\dfrac{\partial f}{\partial t} である2変数関数です。

このような誤解がなくならない理由は、これがかなりもっともらしいからです。実際には、変数間に(t,x)(t,x) のような関係があると仮定する場合、そもそもx=x(t)x = x(t) で偏微分するという表現自体を使用する必要がありません。チェーンルールに従えば、 dfdt=ddt(t2+x2)=2t+dx2dxdxdt=2t+2xx˙ \begin{align*} {{ d f } \over { d t }} =& {{ d } \over { d t }} \left( t^{2} + x^{2} \right) \\ =& 2t + {{ d x^{2} } \over { d x }} {{ dx } \over { dt }} \\ =& 2t + 2x \dot{x} \end{align*} のように最初から誤解の余地なく式を展開することができます。少なくともこの例では、tt は実質的にf=f(t,x)f = f(t,x) と同じか、むしろ難しいですし、結局のところ教科書ではこのような無意味なケースをすべて排除して、変数間が独立でありながらも依然として多変数関数である形だけが残ります。通常はきれいな例だけを見ながら学び、時間が経ち、偏微分に慣れ、誤った直感が定着し、他の人もそうです。しかし、違うものは違うものです。単に微分の記号を変えるだけで与えられた関数の従属関係を勝手に変えることはできません。