logo

일반화 고유벡터 📂행렬대수

일반화 고유벡터

도입1

행렬고유값 문제란, 주어진 행렬 $A \in M_{n \times n}(\mathbb{C})$에 대해서 다음을 만족하는 벡터 $\mathbf{0} \ne \mathbf{v} \in \mathbb{C}^{n}$와 상수 $\lambda \in \mathbb{C}$를 찾는 것이다.

$$ A \mathbf{v} = \lambda \mathbf{v} \iff (A - \lambda I) \mathbf{v} = \mathbf{0} $$

이때 $\lambda$를 $A$의 고유값, $\mathbf{v}$를 $A$의 고유벡터라 한다. $A$가 $n$개의 선형독립인 고유벡터를 갖는다면 대각화가 가능하고, 좋은 형태로 분해할 수 있다. 하지만 임의의 행렬이 항상 $n$개의 선형독립인 고유벡터를 갖는 것은 아니다. 이런 경우에는 적당한 차선책을 찾아 또 다른 형태로 분해하는 것을 시도하는데, $A$가 정방행렬이 아닐 때 특이값 분해가 그 예이다. 지금은 $A$가 정방행렬이지만 $n$개보다 적은 선형독립 고유벡터를 가지는 경우를 다루자.

위 식에서 알 수 있듯이 고유벡터란, 커널 $\ker (A - \lambda I)$의 원소이기도 하다. $A$가 대각화 불가능하다는 것은 $\ker (A - \lambda I)$의 차원이 충분히 크지 않다(=$n$보다 작다)는 것이다. 그런데 커널은 같은 변환을 반복했을 때 단조롭게 커진다.

$$ \ker(A - \lambda I) \subset \ker(A - \lambda I)^{2} \subset \cdots \subset \ker(A - \lambda I)^{k} \subset \cdots $$

즉 임의의 자연수 $k$에 대해서 아래의 식을 만족하는 벡터 $\mathbf{v}$들의 집합을 고려하면, 이는 기존의 고유벡터들을 모두 포함하는 집합이면서 자연스러운 일반화가 된다.

$$ (A - \lambda I)^{k} \mathbf{v} = \mathbf{0} $$

정의

행렬 $A \in M_{n \times n}(\mathbb{C})$가 주어졌다고 하자. 임의의 상수 $\lambda \in \mathbb{C}$와 자연수 $k \in \mathbb{N}$에 대해서 아래의 식을 만족하는 벡터 $\mathbf{v}$를 $A$의 일반화 고유벡터generalized eigenvector라 한다.

$$ (A - \lambda I)^{k} \mathbf{v} = \mathbf{0} \tag{1} $$

설명

여기서 $\mathbf{v} \ne \mathbf{0}$인 벡터에 대해 의미가 있으므로, $(A - \lambda I)$는 가역행렬이 아니어야 한다. 따라서 $(1)$에서의 $\lambda$는 평범한ordinary 고유값과 같다. 즉 $(1)$을 만족하는 $\lambda$에는 일반화 고유값이라는 이름이 붙지 않는다. 하지만 정의에서 짐작할 수 있듯이, 평범한 고유벡터가 아닌 일반화 고유벡터가 존재한다.

예로서 $2 \times 2$ 행렬 $A = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}$이 주어졌다고 하자. 특성방정식이 $(\lambda - 1)^{2} = 0$이므로, $A$의 고유값은 대수적 중복도가 $2$인 고유값 $\lambda = 1$이 하나 있다. 이에 대응되는 (선형독립인) 고유벡터는 아래와 같이 하나이기 때문에 $A$는 고유값 대각화가 불가능하다.

$$ \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \implies \mathbf{x}_{1} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} $$

이제 $k = 2$인 경우를 살펴보자. 아래와 같이 $\mathbf{x}_{1}$과 선형독립인 $\mathbf{x}_{2}$를 찾을 수 있다.

$$ \begin{align*} (A - \lambda I)^{2} \mathbf{x} = \mathbf{0} &\implies \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}\begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \\ &\implies \begin{bmatrix} 0 & 0 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \\ &\implies \mathbf{x}_{2} = \begin{bmatrix} 0 \\ 1 \end{bmatrix} \end{align*} $$

그런데 고유벡터 $\mathbf{x}_{1}$과 일반화 고유벡터 $\mathbf{x}_{2}$를 찾기 위한 식을 다시 보면, 결국 $\mathbf{x}_{2}$는 $(A - \lambda I)$를 취해서 $\mathbf{x}_{1}$가 되는 벡터라는 것을 알 수 있다.

$$ \begin{align*} && (A - \lambda I) \mathbf{x}_{1} &= \mathbf{0} \\ && (A - \lambda I)^{2} \mathbf{x}_{2} = (A - \lambda I) \left[ (A - \lambda I) \mathbf{x}_{2} \right] &= \mathbf{0} \\ \implies && (A - \lambda I) \mathbf{x}_{2} &= \mathbf{x}_{1} \end{align*} $$

그래서 고유값 $\lambda = 1$에 대응되는 일반화 고유벡터는 (평범한 고유벡터를 포함하여) 총 $2$개이다. 이 숫자가 $\lambda = 1$의 대수적 중복도와 같은 것은 우연이 아니다. 고유값의 기하적 중복도는 항상 대수적 중복도보다 작거나 같은데, 기하적 중복도는 고유값에 대응되는 선형독립인 평범한 고유벡터의 개수와 같고, 대수적 중복도는 고유값에 대응되는 선형독립인 일반화 고유벡터의 개수와 같다.

일반화 고유공간

고유값 $\lambda$에 대한 고유공간 $E_{\lambda}$는 $\lambda$에 대응되는 고유벡터들이 생성하는 공간을 의미한다. 이의 확장으로, 일반화 고유공간generalized eigenspace $W_{\lambda}$를 $\lambda$에 대응되는 일반화 고유벡터가 생성하는 공간으로 아래와 같이 정의한다. 행렬 $A \in M_{n \times n}(\mathbb{C})$와 이의 고유값 $\lambda$에 대해서,

$$ W_{\lambda} = \left\{ \mathbf{v} \in \mathbb{C}^{n} : (A - \lambda I)^{k} \mathbf{v} = \mathbf{0} \text{ for some } k \in \mathbb{N} \right\} $$


  1. Brian C. Hall. Lie Groups, Lie Algebras, and Representations (2nd), p411-413 ↩︎