연립방정식으로 이해하는 랭크와 무효차수
역사적 배경
역사적으로는 행렬이 고안된 배경 자체가 연립방정식을 보다 쉽고 편하게 표기하기 위함이었다. 예를 들어 연립방정식
$$ \begin{cases} 2x_{1} & + & x_{2} & + & x_{3} =& 0 \\ & x_{2} & =& 0 \end{cases} $$
을 잘 보면, 같은 변수를 여러번 써야한다는 불편함이 있다. 이를 행렬로 나타내면
$$ \begin{bmatrix} 2 & 1 & 1 \\ 0 & 1 & 0 \end{bmatrix} \begin{bmatrix} x_{1} \\ x_{2} \\ x_{3} \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} $$
와 같이 각 잡힌 모양으로 깔끔하게 나타낼 수 있다. 수식을 간단하게 표현하고 쉽게 조작하는 기술의 중요성은 두 말할 것도 없을 것이다. 연립방정식이 크고 복잡할수록 이러한 테크닉은 유용함을 더해갔고, 행렬대수가 발전하게 된다. 그리고 선형 구조에 대한 탐구와 공간의 일반화가 이루어지며 선형대수학이라는 이름으로 완성된 것이다.
이해하기 어려운 이유
그런데 배우는 입장에선 열공간과 영공간 등의 개념과 함께 추상화되어가는 선형대수학을 따라잡기 힘들 수 있다. 분명히 처음엔 $(1,0, \cdots , 0)$ 처럼 생긴 벡터였는데 어느 순간부터 행렬은 온데간데 없고 새로운 개념들이 쏟아지기 때문이다.
예를 들어 $\dim \mathcal{C} (A) = \text{rank}(A)$나 $\dim \mathcal{N} (A) = \text{nullity} (A)$같은 표현은 쓰기엔 깔끔하지만 의미를 이해하기는 어렵다. 여기서 다시 연립방정식의 개념으로 돌아가보면, 이러한 $\text{rank}$ 와 $\text{nullity}$ 를 쉽게 이해할 수 있다.
예시
위에서 예로 들었던
$$ \begin{cases} 2x_{1} & + & x_{2} & + & x_{3} =& 0 \\ & x_{2} & =& 0 \end{cases} $$
을 보면 식은 2개인데 미지수는 3개다. 알다시피 연립방정식의 해가 자명하지 않으면서 유일한 해를 가지는 경우는 식의 갯수와 미지수의 갯수가 같을 때 뿐이다. 따라서 $x_2 = 0$ 이고 $2 x_1 = - x_3$ 이 되어 2개의 변수만을 가지고 해를 표현할 수 있게 된다. 이런 의미에서, 해를 표현할 때 $\text{rank}$ 를 ‘실제로 쓰는 변수의 갯수’로, $\text{nullity}$ 를 ‘안 쓰는 변수의 갯수’로 생각해보자.
$A \in \mathbb{R}^{ m \times n }$ 에 대해,
$$ \begin{align*} \text{rank} (A) + \text{nullity} (A) =& \dim \mathbb{R}^{n} = n \\ \text{rank} (A^{T}) + \text{nullity} (A^{T}) =& \dim \mathbb{R}^{m} = m \end{align*} $$
정리를 사용해서 얻은 설명과 맞아떨어지는지 한번 확인해보도록 하자.
$$ A = \begin{bmatrix} 2 & 1 & 1 \\ 0 & 1 & 0 \end{bmatrix} $$ 라고 하면 $A \in \mathbb{R}^{ 2 \times 3 }$ 이다.
$$ \dim \mathcal{C} (A) = \dim \text{span} \left\{ \begin{bmatrix} 2 \\ 1 \\ 1 \end{bmatrix} , \begin{bmatrix} 0 \\ 1 \\ 0 \end{bmatrix} \right\} = 2 $$
이고
$$ \dim \mathcal{N} (A) = \dim \text{span} \left\{ \begin{bmatrix} 1 \\ 0 \\ -2 \end{bmatrix} \right\} = 1 $$
이므로
$$ \text{rank} (A) + \text{nullity}(A) = 2 + 1 = 3 = \dim (\mathbb{R}^{3}) $$
이 된다.