logo

야코비 공식 📂다변수벡터해석

야코비 공식

공식

$A = A(t)$를 미분가능한 행렬함수라 하자. 행렬식 $\det A(t)$의 도함수는 다음과 같다.

$$ \dfrac{\mathrm{d}}{\mathrm{d} t} \det A(t) = \Tr \Big( (\operatorname{adj}A(t)) \dfrac{\mathrm{d}A(t)}{\mathrm{d}t} \Big) = \det A(t) \cdot \Tr\left( A^{-1}(t) \dfrac{\mathrm{d}A(t)}{\mathrm{d}t} \right) $$

이를 야코비 공식Jacobi’s formula이라 한다. 전미분꼴로 쓰면 다음과 같다. 두번째 등호는 $A$가 가역행렬일 때 성립한다.

$$ \mathrm{d}(\det A) = \Tr \Big( (\operatorname{adj}A) \mathrm{d}A \Big) = \det A \cdot \Tr(A^{-1} \mathrm{d}A) $$

$\operatorname{adj}$는 수반행렬, $\Tr$은 트레이스, $\mathrm{d}A$는 행렬미분소를 의미한다.

증명

간단히 $A = A(t)$라 표기하고, $A = [A_{ij}]$라고 하자. 행렬의 라플라스 전개는 다음과 같다.

$$ \det A = \sum\limits_{j} A_{ij} [\operatorname{adj}A]_{ji} \qquad \text{for fixed }i $$

행렬식을 $n^{2}$개의 변수를 갖는 다변수함수 $\det(A) = F(A_{11}, A_{12}, \dots, A_{nn})$로 보면, 그 전미분은 다음과 같다.

$$ \mathrm{d} (\det A) = \sum_{i,j} \dfrac{\partial F}{\partial A_{ij}}\mathrm{d}A_{ij} $$

편미분을 계산해보면 다음과 같다.

$$ \begin{align*} \dfrac{\partial F}{\partial A_{ij}} &= \dfrac{\partial }{\partial A_{ij}}\left( \sum\limits_{k} A_{ik} [\operatorname{adj}A]_{ki}\right) \\ &= \sum\limits_{k} \left( \dfrac{\partial A_{ik}}{\partial A_{ij}} [\operatorname{adj}A]_{ki} + A_{ik}\dfrac{\partial }{\partial A_{ij}}[\operatorname{adj}A]_{ki} \right) \\ &= \sum\limits_{k} \dfrac{\partial A_{ik}}{\partial A_{ij}} [\operatorname{adj}A]_{ki} + \sum\limits_{k}A_{ik}\dfrac{\partial }{\partial A_{ij}}[\operatorname{adj}A]_{ki} \\ &= [\operatorname{adj}A]_{ji} + \sum\limits_{k}A_{ik}\dfrac{\partial }{\partial A_{ij}}[\operatorname{adj}A]_{ki} \\ \end{align*} $$

그런데 여인자의 정의를 생각해보면, 모든 $k$에 대해서 $[\operatorname{adj}A]_{ki}$는 $A_{ij}$를 포함하지 않으므로 $A_{ij}$에 대한 편미분은 $0$이다.

$$ \dfrac{\partial F}{\partial A_{ij}} = [\operatorname{adj}A]_{ji} \tag{1} $$

따라서 다음을 얻는다.

$$ \begin{align*} \mathrm{d}(\det A) &= \sum\limits_{i,j} [\operatorname{adj}A]_{ji} \mathrm{d}A_{ij} \\ &= \sum\limits_{i} \sum\limits_{j} [\operatorname{adj}A]_{ji} \mathrm{d}A_{ij} \\ &= \sum\limits_{j} [(\operatorname{adj}A) \mathrm{d}A]_{jj} \\ &= \Tr \Big( (\operatorname{adj}A) \mathrm{d}A \Big) \end{align*} $$

세번째 등호는 행렬곱의 표현에 의해, 네번째 등호는 트레이스의 정의에 의해 성립한다. $\mathrm{d}A$는 행렬미분소이다.

한편 $A$가 가역행렬이면 $\operatorname{adj}A = (\det A) A^{-1}$이고, $\Tr(kA) = k\Tr(A)$이므로 다음을 얻는다.

$$ \mathrm{d}(\det A) = \Tr \Big( (\operatorname{adj}A) \mathrm{d}A \Big) = \Tr \Big( (\det A) A^{-1} \mathrm{d}A \Big) = \det A \Tr \Big( A^{-1} \mathrm{d}A \Big) $$

한편 $\dfrac{\mathrm{d} (\det A)}{\mathrm{d}t}$는 연쇄법칙에 의해 다음과 같다.

$$ \dfrac{\mathrm{d} (\det A)}{\mathrm{d}t} = \dfrac{\mathrm{d} (\det A)}{\mathrm{d}A} \cdot \dfrac{\mathrm{d}A}{\mathrm{d}t} $$

$(1)$에 의해 $\dfrac{\mathrm{d} (\det A)}{\mathrm{d}A} = (\operatorname{adj}A)^{\mathsf{T}}$이고 $AB = \Tr(A ^{\mathsf{T}}B)$이므로,

$$ \dfrac{\mathrm{d} (\det A)}{\mathrm{d}t} = (\operatorname{adj}A)^{\mathsf{T}} \dfrac{\mathrm{d}A}{\mathrm{d}t} = \Tr \left( (\operatorname{adj}A) \dfrac{\mathrm{d}A}{\mathrm{d}t} \right) = \det A \cdot \Tr \left( A^{-1} \dfrac{\mathrm{d}A}{\mathrm{d}t} \right) $$