行列値関数の微分
概要
行列値関数の微分を定義する。行列値関数の微分を定義する方式はベクトル値関数の微分を定義する場合と同じである。スカラー関数の微分を各成分に適用することで自然に定義される。
$\mathbf{A} : I \subset \mathbb{R} \to \mathbb{R}^{n \times m}$を行列値関数とする。
$$ \mathbf{A}(t) = \begin{bmatrix} a_{11}(t) & \cdots & a_{1m}(t) \\ \vdots & \ddots & \vdots \\ a_{n1}(t) & \cdots & a_{nm}(t) \end{bmatrix} $$
以下の極限が存在すれば $\mathbf{A}$ は $t$ において微分可能であるdifferentiable at $t$と言い、その値を $\mathbf{A}$ の $t$ における微分係数という。
$$ \dfrac{d}{dt} \mathbf{A}(t) = \mathbf{A}^{\prime}(t) := \lim_{h \to 0} \dfrac{\mathbf{A}(t+h) - \mathbf{A}(t)}{h} $$
任意の $t \in I$ に対して $\mathbf{A}^{\prime}(t)$ が存在すれば $\mathbf{A}$ は $I$ において 微分可能である といい、 $\mathbf{A}^{\prime}$ を $\mathbf{A}$ の 導関数derivativeという。
説明
行列値関数の微分は本質的にベクトル値関数の場合と完全に同一であり、行列をひとつのベクトル $\mathbb{R}^{n \times m} \cong \mathbb{R}^{nm}$ と見なせば自然に理解できる。定義により $\mathbf{A}$ が微分可能であることは各成分が微分可能であることと同じである。すなわち $\mathbf{A}$ の導関数は次のようになる。
$$ \begin{bmatrix} \dfrac{d \mathbf{A}}{dt} \end{bmatrix}_{ij} = \dfrac{d a_{ij}}{dt} $$
ベクトル値関数の場合と異なる点は、行列にのみ定義される行列積、転置、トレース、行列式、逆行列に関する事項などである。
性質
$\mathbf{A}$ が微分可能であれば、次の関数群も同様であり式は以下の通りである。
(a) $\dfrac{d}{dt}(\mathbf{A} + \mathbf{B}) = \dfrac{d\mathbf{A}}{dt} + \dfrac{d\mathbf{B}}{dt}$
(b) $\dfrac{d}{dt}(c\mathbf{A}) = c\dfrac{d\mathbf{A}}{dt}$
(c) $\dfrac{d}{dt}(\mathbf{A}\mathbf{B}) = \dfrac{d\mathbf{A}}{dt}\mathbf{B} + \mathbf{A}\dfrac{d\mathbf{B}}{dt}$
(d) $\dfrac{d}{dt}(\mathbf{A}^{\mathsf{T}}) = \left(\dfrac{d\mathbf{A}}{dt}\right)^{\mathsf{T}}$
(e) $\dfrac{d}{dt}(\tr\mathbf{A}) = \tr\left(\dfrac{d\mathbf{A}}{dt}\right)$
(f) $\dfrac{d}{dt}(\det\mathbf{A}) = \det\mathbf{A} \cdot \tr\left(\mathbf{A}^{-1}\dfrac{d\mathbf{A}}{dt}\right)$
(g) $\dfrac{d}{dt}(\mathbf{A}^{-1}) = -\mathbf{A}^{-1}\dfrac{d\mathbf{A}}{dt}\mathbf{A}^{-1}$
(h) $\dfrac{d}{dt} \Braket{\mathbf{A}, \mathbf{B}} = \Braket{\dfrac{d\mathbf{A}}{dt}, \mathbf{B}} + \Braket{\mathbf{A}, \dfrac{d\mathbf{B}}{dt}}$
証明
上の式を成分ごとに書き下すと、微分可能なスカラー関数たちの和と積として表される。微分可能な関数の和と積も依然として微分可能であるため、上述の性質が成り立つ。
(f)
これをヤコビの公式という。
$$ \dfrac{d}{dt} (\det \mathbf{A}(t)) = \det \mathbf{A}(t) \cdot \tr\left( \mathbf{A}(t)^{-1} \dfrac{d\mathbf{A}(t)}{dt} \right) $$
■
(g)
逆行列へ送る写像が微分可能であるため、逆行列も微分可能である。 $\mathbf{A} \mathbf{A}^{-1} = I$ の両辺を微分すると次のようになる。
$$ \dfrac{d}{dt}(\mathbf{A} \mathbf{A}^{-1}) = \dfrac{d \mathbf{A}}{dt} \mathbf{A}^{-1} + \mathbf{A}\dfrac{d \mathbf{A}^{-1}}{dt} = \dfrac{d I}{dt} = O $$
$\dfrac{d \mathbf{A}^{-1}}{dt}$ について整理すると次を得る。
$$ \dfrac{d \mathbf{A}^{-1}}{dt} = -\mathbf{A}^{-1}\dfrac{d \mathbf{A}}{dt}\mathbf{A}^{-1} $$
$1 \times 1$ 行列、すなわちスカラーの場合を考えると元々知っている公式と同じである。例えば $x^{-1}$ を見ると、 $\dfrac{d x^{-1}}{dx} = - x^{-1} \dfrac{dx}{dx} x^{-1} = -x^{2}$ である。
■
