타원의 일반화: 일립소이드
정의
선형 변환 $A \in \mathbb{R}^{m \times m}$ 에 대해 $m$차원 단위구 $N := \left\{ \mathbf{x} \in \mathbb{R}^{m} : \left\| \mathbf{x} \right\|_{2} = 1 \right\}$ 의 이미지 $AN$ 을 일립소이드라 한다. $A$ 의 아이겐 밸류 $\sigma_{1}^{2} > \cdots \ge \sigma_{m}^{2} \ge 0$ 와 그에 따른 단위 아이겐 벡터 $u_{1} , \cdots , u_{m}$ 에 대해 $\sigma_{i} u_{i}$ 를 일립소이드의 축axis라 한다.
설명
$m$차원 단위구는 중심이 $\mathbb{0} \in \mathbb{R}^{m}$ 이고 반지름이 $1$ 인 점들을 모아놓은 집합으로, $m=2$ 일 때 우리가 흔히 알고 있는 단위원이 된다.
일립소이드는 타원체 혹은 초타원hyperellipse라도 불리는 도형으로써, 타원면 이나 타원구면 등의 명칭이 틀렸다기보다는 이러한 순화에 의미를 두지 않고 그냥 읽고 있는 글의 맥락을 따라서 그 정의를 파악하는 게 좋다. 어디서는 속까지 꽉 찬 걸 일립소이드라 부르기도 하고, 어디서는 그 껍질만을 일립소이드라고 부르기도 한다.
기하
선형 변환에 충분히 익숙하다면 이것이 왜 타원을 다차원으로 확장한 것이라고 부르는지 쉽게 이해할 수 있을 것이고, 직관적인 예로는 단위원의 모든 점에 $A = \begin{bmatrix} 2 & 0 \\ 0 & 1 \end{bmatrix}$ 을 취해서 가로로 길게 들인 모습을 상상하면 좋다. 이는 원의 방정식 $N : x^{2} + y^{2} = 1$ 의 해들이 선형 변환 $A$ 를 통해 $\displaystyle AN : {{ x^{2} } \over { 2 }} + y^{2} = 1$ 의 해들로 변한 것이다. 이 때 $A$ 의 고유값은 $\sqrt{2}^{2} , \sqrt{1}^{2}$ 이므로 일립소이드 $AN$ 의 축은 당연히 $\sqrt{2}(1,0)$ 와 $\sqrt{1}(0,1)$ 이다.
선형대수
일립소이드를 말할 때 아이겐 밸류를 굳이 $\sigma_{i}^{2}$ 라고 쓰는 것은 일립소이드가 특이값 분해와 밀접한 관계를 가지고 있기 때문이다. 특이값 분해는 수치선형대수적으로 $A \in \mathbb{R}^{m \times n}$ 에 대해
$$ A v_{i} = \sigma_{i} u_{i} $$
을 만족하는 어떤 $\sigma_{i}>0$ 와 $v_{i} \in \mathbb{R}^{n}$, $u_{i} \in \mathbb{R}^{m}$ 을 찾는 메소드다. 특이값 분해의 존재성 증명에서 $\sigma_{i}^{2}$ 은 $A^{T}A$ 의 고유값이며, 단위 아이겐 벡터 $u_{1} , \cdots , u_{m}$ 는 상호 독립이다. 이러한 점에서 $\sigma_{i} u_{i}$ 를 축이라고 부르는 것은 자연스러운 정의가 된다.
일반화
한편 선형대수적인 설명에서 알 수 있듯 원래 일립소이드는 $A \in \mathbb{R}^{m \times n}$ 에 대해서도 일반화가 가능하다. 다만 읽는 입장에서 보면 특이값과 고유값의 관계를 이해하기도 어렵고 기하학적인 의미가 심히 약해져서 부득이 $A \in \mathbb{R}^{m \times m}$ 에 대한 정의를 소개했다. 이 정의를 추상적으로 이해하는데에 성공했다면 $A$ 의 랭크 $r = \dim C (A)$ 에 대해 $\sigma_{r+1} = \cdots = \sigma_{m} = 0$ 으로 두고 더욱 일반적인 일립소이드의 정의를 받아들일 수 있을 것이다. 다만 이제 $\sigma_{i}^{2}$ 는 $A$ 의 고유값이라고 할 수 없으며, 특이값 분해 이야기를 꺼내지도 않는다면 ‘어떤 양수 $\sigma_{i}>0$‘라고 부르는 수밖에 없을 것이다.