偏微分の記号を使い分ける理由

質問

偏微分では、通常の微分と異なり、$\displaystyle {{ d f } \over { d t }}$ の代わりに $\displaystyle {{ \partial f } \over { \partial t }}$ のような表現を使用します。$\partial$ は[ラウンドディー]^{round Dee}または[パーシャル]^partialと読み、歴史的にも$d$ を丸めて書いた[カーリーディー]^{curly Dee}から由来しています。¹ $\TeX$ のコードでは \partial であり、韓国では[ラウンドディー]さえも長いと考えるのか、単に[ラウンド]と読む人も多いです。

なぜ $d$ を $\partial$ で書くのか？

問題は、偏微分が単に他の変数に関して微分するだけなのに、なぜ記号を異なるものにする必要があるのかということが納得できないということです。学部の授業レベルでは、偏微分が初めて登場するたびに必ず出てくる質問ですが、実際の答えは、数学科でなければ「そんなことは数学科で考えることだ」または数学科であっても「ただの表記の違いとして受け入れても問題ない」という程度で返ってくることがあります。これが決して間違っているわけではないのは、$d$ で書こうが $\partial$ で書こうが、数学科でなければそれが特に重要なわけではなく、数学科であっても式の意味自体が変わるわけではないからです。例えば、熱方程式を学ぶ場合、 $$ {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} $$ の $\partial$ を通常の微分表記 $d$ に変えて $$ {{ d u } \over { d t }} = {{ d u } \over { d x^{2} }} $$ と書いた場合、2つの方程式が同じかどうかを尋ねることができます。非常に混乱することに、その答えは「実際には同じ」なので、この時点で多くの学生が $d$ と $\partial$ の区別に意味がないと感じたり、定義レベルで受け入れてしまったりすることになります。

回答

ニュートンとライプニッツ

本格的な偏微分の話に入る前に、微分の2人の父、ニュートン^Newtonとライプニッツ^Leibnizの話を面白い読み物として取り上げたいと思います。現代において、両者は独自に微分の概念および記法を考案したと認められていますが、関数$y = f(x)$ の導関数を表す際、ニュートンは $$ y ' = f ' (x) $$ のような表記を使用し、ライプニッツは $$ {{ dy } \over { dx }} = {{ d f(x) } \over { dx }} $$ のような表記を使用しました。同じ微分であっても、このように表現の違いが生じるのは、両者の思考方法や微積分に対する見方自体が異なっていたためです。現在では、同時代に独自に微分を考案した人がもう一人いても良かったと思えるほど、幸運なことです。ニュートンは古典力学の巨匠として、「位置を一度微分すると速度、二度微分すると加速度」といった話をしなければならず、この時 $$ \begin{align*} v =& x ' \\ a =& v ' = x '' \end{align*} $$ のような表現は非常にすっきりして効率的です。ライプニッツは幾何学的^geometricな観点から見るとより理にかなっており、直線の傾きが横と縦の変化量の比として定義されるため、曲線では非常に小さな単位を与えて $$ {{ \Delta y } \over { \Delta x }} \approx {{ d y } \over { d x }} $$ のように接線の傾きに自然に近づくことができます。興味深いことに、ここまで述べたのは全て通常の微分に関するものであり、分野によっては以下のような表記の分化が起こり、ニュートンとライプニッツの表記が共存することができるという事実です。

微分幾何学における$s$ に対する微分と$t$ に対する微分の表記： $$ {{ df } \over { ds }} = f^{\prime} \quad \text{and} \quad {{ df } \over { dt }} = \dot{f} $$ ドット$\dot{}$ やプライム$'$ はどちらも微分を表していますが、微分幾何学の文脈では上記のように記号を区別することができます。通常、$s$ は単位速度曲線のパラメータであり、$t = t(s)$ は曲線の長さの再パラメータ化によって表されます。

この表記は、微分という概念が変形されて出てきたわけではありません。微分幾何学では、単に$s$ で多くの微分を行い、$t$ でも多くの微分を行う必要があるため、ニュートンの表記では何に対して微分しているのか区別できず、ライプニッツの表記では数式が複雑すぎるため、両者の長所を取り入れるために新たな表記を作成したものです。

本当に興味深いのは、このように幾何学的な観点から$s$ や $t$ は単なるパラメータに過ぎないにもかかわらず、常微分方程式の中でも特に時間^timeによる変化を表す場合には、その頭文字を取って$t$ に対する$v$ の導関数を$v '$ ではなく$\dot{v}$ と書くようになりました。これにより、ダイナミクスなどのほとんどのシステムで時間による変化を記述する際には、$v '$ の代わりに $$ \dot{v} = f(v) $$ という表現を好んで使用するようになりました。ポイントは、「何によって微分するか」を明確かつすっきりと表現するための検討自体が、偏微分という枠組みに縛られなくても自然に浮かぶことができるということです。

多変数関数の暗示

前節では、$f '$ と $\dot{f}$ が単に表現の違いだけで、どの変数によって微分されたかを区別できること、特にダイナミクスシステムでは、時間$\dot{v} = f(v)$ が現れなくても、一般的な規約とコンテキストからそれが時間による微分であることを暗示できることを指摘しました。このように表現によって暗黙的^implicitにわかる情報についてもう少し話してみたいと思います。

再び偏微分に戻ると、$d$ と $\partial$ の表記がどのように異なるかを実感するのが難しいのは、その式自体が示す偏導関数に違いがないからです。例えば、$f$ を$t$ で微分した導関数が$g$ である場合、その$g$ は $$ g = {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} $$ のように$d$ で表されても$\partial$ で表されてもあまり関係がない。記号がどうであれ、$t$ で微分された「結果」である$g$ が同じだからです。しかし、$\partial$ が暗黙的に与える情報は$g$ ではなく$f$ に関するものです。ある関数$h$ が$H$ に関して$x$ で微分された結果だとすると、次のように2つの表現を比較してみましょう：

偏微分表現を使用しない場合：$\displaystyle h = {{ d H } \over { d x }} \implies$ $H$ を微分すると$h$ になるらしい。
偏微分表現を使用する場合：$\displaystyle h = {{ \partial H } \over { \partial x }} \implies$ なぜこれだけ？何か$y$ があって$H = H (x , y)$ になるんだろう？

つまり、$\partial$ という記号は、与えられた関数が多変数関数であることを暗示しているのです。多くの場合、偏微分に初めて本格的に触れるのは通常偏微分方程式であり、 $$ {{ \partial u } \over { \partial t }} = {{ \partial u } \over { \partial x^{2} }} $$ のような方程式があれば、私たちは$u$ を$t$ で微分した偏導関数$u_{t}$ が気になるわけではなく、$u$ を$x$ で2回微分した2階偏導関数$u_{xx}$ が気になるわけでもなく、その両方が等しいときの$t$ と$x$ の関数$u = u (t,x)$ が何であるかが気になるのです。この観点から、偏微分に使用される$\partial$ が偏微分方程式の記述に使用されるのは妥当で自然だと主張することができます。

一方で、このような慣習が広く受け入れられることにより、$d$ 自体の意味も変わります。多変数関数ではない関数をわざわざ$\partial$ で微分することは意味がないため、導関数の表現に$d$ が使用されていれば、それは多変数関数ではないことを暗示することになります。例えば、2変数関数$u = u (t,x)$ に対して位置を一点に固定して$u = u \left( t , x_{0} \right)$ とすると、 $$ \left. {{ \partial u } \over { \partial t }} \right|_{x = x_{0} } = {{ d u } \over { d t }} = \dot{u} $$ のような式は、$\partial$ と$d$ の暗黙的な情報伝達を非常にうまく活用しています。これは、単なる表現の違いにとどまらず、実際に式を扱う思考方法にも影響を与え、偏微分方程式の問題を比較的簡単な常微分方程式に変換して解くといったアイデアにつながることもあります。

✅ 全微分における混乱を避けるために

$$ df = \frac{ \partial f}{ \partial x_{1} }dx_{1} + \frac{ \partial f}{ \partial x_{2} }dx_{2} + \cdots + \frac{ \partial f}{ \partial x_{n} }dx_{n} $$ 多変数関数$f : \mathbb{R}^{n} \to \mathbb{R}$ に対する数理物理学などで使用される全微分は、通常上記のような形で表され、もう少し直感的に書くために$n = 3$ のとき次のように$t,x,y,z$ のみを書き、$x,y,z$ は互いに独立であるとしましょう。 $$ df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz $$ 一見すると、$d$ と$\partial$ が混在していて複雑に見えますが、ライプニッツの遺産に従って「両辺を$dt$ や$dx$ で割る」ような操作を行うと、 $$ \begin{align*} df =& {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \\ {{ d f } \over { d t }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d t }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d t }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d t }} \\ {{ d f } \over { d x }} =& {{ \partial f } \over { \partial x }} {{ d x } \over { d x }} + {{ \partial f } \over { \partial y }} {{ d y } \over { d x }} + {{ \partial f } \over { \partial z }} {{ d z } \over { d x }} = {{ \partial f } \over { \partial x }} \end{align*} $$ のように$f$ を$t$ で微分する意味と$x$ で偏微分する意味が同時によく表現されていることがわかります。これは全微分の形が数式的に扱う上で非常に便利であることを示していますが、全微分で$\partial$ をすべて取り除いて$d$ で統一して再度書き直すと次のようになります。 $$ df = {{ d f } \over { d x }} dx + {{ d f } \over { d y }} dy + {{ d f } \over { d z }} dz $$ もちろん、ライプニッツの微分記法が分数の分子と分母を扱うときのように非常に直感的であることは事実ですが、この記事を読んでいる皆さんであれば、$dx$ や$dy$、$dz$ を本当にそのように扱ってはいけないことを知っているでしょう。それにもかかわらず、皆さんの内なる本能はこのように約分するように叫ぶでしょう。 $$ \begin{align*} df =& {{ d f } \over { dx }} dx + {{ d f } \over { dy }} dy + {{ d f } \over { dz }} dz \\ \overset{?}{=} & {{ d f } \over { \cancel{dx} }} \cancel{dx} + {{ d f } \over { \cancel{dy} }} \cancel{dy} + {{ d f } \over { \cancel{dz} }} \cancel{dz} \\ =& df + df + df \\ \overset{???}{=}& 3 df \end{align*} $$ このような惨事は、$d$ が$\partial$ と同じになる条件を見落としたために起こった循環論法と見ることができます。’$\partial$ をすべて取り除いて$d$ で統一して再度書き直す’という展開を無造作に行うことがあまりにも大胆であるため、何らかの方法で$\partial$ を$d$ で置き換えてもよいと考えること自体が、$x,y,z$ が独立である場合 $$ df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz \implies {{ d f } \over { d x }} = {{ \partial f } \over { \partial x }} \implies d \equiv \partial $$ から出てきたものです。その一方で、$d \equiv \partial$ の根拠となる$df = {{ \partial f } \over { \partial x }} dx + {{ \partial f } \over { \partial y }} dy + {{ \partial f } \over { \partial z }} dz$ を無闇にいじると、どのような方法でも必ず問題が発生します。$d$ と$\partial$ が等しくなるには、例で仮定したように多変数関数の変数が互いに独立である場合や、何らかの特別な条件の下での何らかの驚くべき定理を通じて、$d$ と$\partial$ が本当に同じである必要があります。

これまでの考察から、偏微分で$d$ の代わりに$\partial$ を使用する理由は、実際にそれらが異なるためであると要約することができます。これまで見てきた、$d$ と$\partial$ が同じだったすべての例は、必ずそのための仮定を暗黙的に含んでいます。その良い仮定の中で、$\partial$ が実質的に$d$ と同じになるかもしれませんが、だからといってわざわざ$\partial$ を$d$ で書き直す必要もないのです。

❌ 微分する変数以外は定数とみなすために？

結論から言うと、間違った答えです。

もっと正確に言うと、現象を説明する因果関係が逆転しています。例えば、$f(t,x) = \left( t^{2} + x^{2} \right)$ であれば、形式的に^formally$\partial t$ 以外の変数を定数として $$ {{ \partial f } \over { \partial t }} = 2t + 0 = 2t = {{ d f } \over { d t }} $$ ではないのは、前節で見たように、$t$ と$t$ が独立であるという仮定$x$ の下で $$ \begin{align*} & df = {{ \partial f } \over { \partial t }} dt + {{ \partial f } \over { \partial x }} dx \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} {{ dt } \over { dt }} + {{ \partial f } \over { \partial x }} {{ dx } \over { dt }} \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \cdot 1 + {{ \partial f } \over { \partial x }} \cdot 0 \\ \implies & {{ d f } \over { d t }} = {{ \partial f } \over { \partial t }} \end{align*} $$ が成立するからです。偏微分$\displaystyle {{ dx } \over { dt }} = 0$ 自体が$\partial$ という結果をもたらしたのではなく、$\displaystyle {{ dx } \over { dt }} = 0$ という原因が$\displaystyle {{ dx } \over { dt }} = 0$ という結果をもたらしたのです。このように「偏微分は微分する変数以外を定数として扱う」という説明は、まるで通常の微分$\partial \equiv d$ と異なり、偏微分$d$ がより強力なオペレーターであるかのような印象と誤解を与えます。また、$\partial$ を定数として扱った場合、$x$ で微分した後には消えるはずですが、単純に$t$ のような例を考えると、$f(t,x) = t^{2} + x^{2} + 2tx$ は依然として変数が$\dfrac{\partial f}{\partial t}$ である2変数関数です。

このような誤解がなくならない理由は、これがかなりもっともらしいからです。実際には、変数間に$(t,x)$ のような関係があると仮定する場合、そもそも$x = x(t)$ で偏微分するという表現自体を使用する必要がありません。チェーンルールに従えば、 $$ \begin{align*} {{ d f } \over { d t }} =& {{ d } \over { d t }} \left( t^{2} + x^{2} \right) \\ =& 2t + {{ d x^{2} } \over { d x }} {{ dx } \over { dt }} \\ =& 2t + 2x \dot{x} \end{align*} $$ のように最初から誤解の余地なく式を展開することができます。少なくともこの例では、$t$ は実質的に$f = f(t,x)$ と同じか、むしろ難しいですし、結局のところ教科書ではこのような無意味なケースをすべて排除して、変数間が独立でありながらも依然として多変数関数である形だけが残ります。通常はきれいな例だけを見ながら学び、時間が経ち、偏微分に慣れ、誤った直感が定着し、他の人もそうです。しかし、違うものは違うものです。単に微分の記号を変えるだけで与えられた関数の従属関係を勝手に変えることはできません。

https://math.stackexchange.com/a/2000353/459895 ↩︎