야코비 행렬 혹은 자코비 행렬이란

야코비 행렬 혹은 자코비 행렬이란

정의

$D \subset \mathbb{R}^{n}$ 에서 정의된 다변수 벡터 함수 $\mathbb{f} : D \to \mathbb{R}^{m}$ 가 각각의 스칼라 함수 $f_{1} , \cdots , f_{m} : D \to \mathbb{R}$ 에 대해

$$ \mathbb{f} ( x_{1} , \cdots , x_{n} ) : = \begin{bmatrix} f_{1} ( x_{1} , \cdots , x_{n} ) \\ \vdots \\ f_{m} ( x_{1} , \cdots , x_{n} ) \end{bmatrix} $$

과 같이 정의되었다고 하자.

$$ J := \begin{bmatrix} {{\partial f_{1} } \over {\partial x_{1} }} & \cdots & {{\partial f_{1} } \over {\partial x_{n} }} \\ \vdots & \ddots & \vdots \\ {{\partial f_{m} } \over {\partial x_{1} }} & \cdots & {{\partial f_{m} } \over {\partial x_{n} }} \end{bmatrix} $$

을 $\mathbb{f}$ 의 야코비 행렬이라 한다.

설명

다음과 같은 표기도 많이 쓰인다.

$$ J = \dfrac{\partial (f_{1}, \dots f_{m})}{\partial (x_{1}, \dots, x_{n})} $$

$\mathbb{f}$ 의 야코비 행렬은 $D \mathbb{f} := J$ 이 되도록 하는 연산자 $D$ 를 정의해서 나타내기도 한다.야코비 행렬이라는 명칭은 19세기 독일의 수학자였던 칼 구스타프 야콥 야코비Carl Gustav Jacob Jacobi에게서 따온 것이므로 야코비 행렬이라고 적고 읽는 게 맞지만, 사실 $J$ 는 ‘자코비안’으로 읽히는 경우가 아주 많다.

전 도함수total derivative라고도 하며, 다변수 벡터함수의 도함수를 의미한다. 따라서 다변수 함수에 대해 야코비 행렬이 존재하면 미분가능 하다고 하며, 오히려 반대로 미분가능한 함수 $f : \mathbb{R} \to \mathbb{R}$ 가 $1 \times 1$ 사이즈의 야코비 행렬을 가진다고 생각할 수도 있다. 쉽게 말해서 야코비안 행렬은 벡터함수의 미분계수 행렬이다.

보통은 극좌표와 함께 미적분학에서 처음 접하게 되는데,

$$ \int_{B} \int_{A} f(x,y) dx dy $$

에서 사용하는 직교좌표를 $x= r \cos \theta$, $y= r \sin \theta$ 와 같이 바꾸면 알다시피

$$ \int_{B} \int_{A} f( r \cos \theta , r \sin \theta ) r dr d \theta $$

와 같이 $r$ 이 하나 더 붙는다. 이것은

$$ \begin{bmatrix} {{\partial x } \over {\partial r }} & {{\partial x } \over {\partial \theta }} \\ {{\partial y } \over {\partial r }} & {{\partial y } \over {\partial \theta }} \end{bmatrix} = \begin{bmatrix} \cos \theta & \sin \theta \\ -r \sin \theta & r \cos \theta \end{bmatrix} $$

의 행렬식이 $r \cos^2 \theta + r \sin^2 \theta = r$ 와 같이 구해지기 때문이다. 같은 센스에서, 야코비 행렬은 고등학교에서 적분의 변수 치환을 할 때 이미 접한 개념이나 마찬가지다. 예를 들어

$$ \int_{0}^{1} ( 27x^3 + 9 x^2 + 3 x ) dx $$

를 계산할 때 $3x = y$ 과 같은 치환을 한다고 생각해보자. 이것을 $y$ 가 $x$ 에 대한 함수 $y(x) = 3x$ 라고 보면 그 야코비 행렬은

$$ \begin{bmatrix} {{\partial 3x } \over {\partial x }} \end{bmatrix} = \begin{bmatrix} 3 \end{bmatrix} $$

이 된다. 이는 $3x = y$ 의 양변을 각자의 변수로 미분해서 $3dx = dy$ 을 얻는 것과 같다.

같이보기

댓글