야코비 행렬 혹은 자코비 행렬이란
정의
$D \subset \mathbb{R}^{n}$ 에서 정의된 다변수 벡터 함수 $\mathbf{f} : D \to \mathbb{R}^{m}$ 가 각각의 스칼라 함수 $f_{1} , \cdots , f_{m} : D \to \mathbb{R}$ 에 대해
$$ \mathbf{f} ( x_{1} , \cdots , x_{n} ) : = \begin{bmatrix} f_{1} ( x_{1} , \cdots , x_{n} ) \\ \vdots \\ f_{m} ( x_{1} , \cdots , x_{n} ) \end{bmatrix} $$
과 같이 정의되었다고 하자.
$$ J := \begin{bmatrix} {{\partial f_{1} } \over {\partial x_{1} }} & \cdots & {{\partial f_{1} } \over {\partial x_{n} }} \\ \vdots & \ddots & \vdots \\ {{\partial f_{m} } \over {\partial x_{1} }} & \cdots & {{\partial f_{m} } \over {\partial x_{n} }} \end{bmatrix} $$
을 $\mathbf{f}$ 의 야코비 행렬이라 한다.
설명
다음과 같은 표기도 많이 쓰인다.
$$ J = \dfrac{\partial (f_{1}, \dots f_{m})}{\partial (x_{1}, \dots, x_{n})} $$
$\mathbf{f}$ 의 야코비 행렬은 $D \mathbf{f} := J$ 이 되도록 하는 연산자 $D$ 를 정의해서 나타내기도 한다.야코비 행렬이라는 명칭은 19세기 독일의 수학자였던 칼 구스타프 야콥 야코비Carl Gustav Jacob Jacobi에게서 따온 것이므로 야코비 행렬이라고 적고 읽는 게 맞지만, 사실 $J$ 는 ‘자코비안’으로 읽히는 경우가 아주 많다.
전 도함수total derivative라고도 하며, 다변수 벡터함수의 도함수를 의미한다. 따라서 다변수 함수에 대해 야코비 행렬이 존재하면 미분가능 하다고 하며, 오히려 반대로 미분가능한 함수 $f : \mathbb{R} \to \mathbb{R}$ 가 $1 \times 1$ 사이즈의 야코비 행렬을 가진다고 생각할 수도 있다. 쉽게 말해서 야코비안 행렬은 벡터함수의 미분계수 행렬이다.
보통은 극좌표와 함께 미적분학에서 처음 접하게 되는데,
$$ \int_{B} \int_{A} f(x,y) dx dy $$
에서 사용하는 직교좌표를 $x= r \cos \theta$, $y= r \sin \theta$ 와 같이 바꾸면 알다시피
$$ \int_{B} \int_{A} f( r \cos \theta , r \sin \theta ) r dr d \theta $$
와 같이 $r$ 이 하나 더 붙는다. 이것은
$$ \begin{bmatrix} {{\partial x } \over {\partial r }} & {{\partial x } \over {\partial \theta }} \\ {{\partial y } \over {\partial r }} & {{\partial y } \over {\partial \theta }} \end{bmatrix} = \begin{bmatrix} \cos \theta & \sin \theta \\ -r \sin \theta & r \cos \theta \end{bmatrix} $$
의 행렬식이 $r \cos^2 \theta + r \sin^2 \theta = r$ 와 같이 구해지기 때문이다. 같은 센스에서, 야코비 행렬은 고등학교에서 적분의 변수 치환을 할 때 이미 접한 개념이나 마찬가지다. 예를 들어
$$ \int_{0}^{1} ( 27x^3 + 9 x^2 + 3 x ) dx $$
를 계산할 때 $3x = y$ 과 같은 치환을 한다고 생각해보자. 이것을 $y$ 가 $x$ 에 대한 함수 $y(x) = 3x$ 라고 보면 그 야코비 행렬은
$$ \begin{bmatrix} {{\partial 3x } \over {\partial x }} \end{bmatrix} = \begin{bmatrix} 3 \end{bmatrix} $$
이 된다. 이는 $3x = y$ 의 양변을 각자의 변수로 미분해서 $3dx = dy$ 을 얻는 것과 같다.