선형변환의 고유공간과 기하적 중복도
📂선형대수 선형변환의 고유공간과 기하적 중복도 정의 V V V 를 n n n 차원 벡터공간 , T : V → V T : V \to V T : V → V 를 선형변환 이라고 하자. λ \lambda λ 를 T T T 의 고유값 이라 하자. 다음과 같이 정의되는 집합 E λ E_{\lambda} E λ 를 고유값 λ \lambda λ 에 대응되는 T T T 의 고유공간 eigenspace 이라 한다.
E λ = V λ : = { x ∈ V : T x = λ x } = N ( T − λ I )
E_{\lambda} = V_{\lambda} := \left\{ x \in V : Tx = \lambda x \right\} = N(T - \lambda I)
E λ = V λ := { x ∈ V : T x = λ x } = N ( T − λ I )
이때 N N N 은 영공간 이다.
비슷하게, 정방행렬 A A A 의 고유공간이란 L A L_{A} L A 의 고유공간으로 정의한다.
설명 고유벡터가 될 조건에는 영벡터가 아니어야한다는 조건이 있지만, E λ E_{\lambda} E λ 의 정의에는 x x x 가 딱히 고유벡터여야한다는 조건은 없다. 따라서 E λ E_{\lambda} E λ 는 λ \lambda λ 에 대응되는 고유벡터들과 영벡터의 집합이다. E λ E_{\lambda} E λ 가 부분공간 이 되려면 영벡터가 있어야함을 유의하자. 실제로 E λ E_{\lambda} E λ 는 V V V 의 부분공간이다. T T T 가 선형변환이므로 덧셈과 상수곱에 대해서 닫혀있음(부분공간 판별법) 이 자명하기 때문이다. x , y ∈ E λ x, y \in E_{\lambda} x , y ∈ E λ 라고 하면,
T ( a x + y ) = a T ( x ) + T ( y ) = a λ x + λ y = λ ( a x + y )
T(ax + y) = aT(x) + T(y) = a\lambda x + \lambda y = \lambda (ax + y)
T ( a x + y ) = a T ( x ) + T ( y ) = aλ x + λ y = λ ( a x + y )
이므로 a x + y ∈ E λ ax + y \in E_{\lambda} a x + y ∈ E λ 이다.
기하적 중복도 고유값 λ \lambda λ 에 대응되는 고유공간 E λ E_{\lambda} E λ 의 차원을 λ \lambda λ 의 기하적 중복도 geometric multiplicity 라고 한다.
다시 말해 λ \lambda λ 에 대응되는 고유벡터 중 선형독립인 벡터들의 수이며, 그러므로 1 1 1 이상의 정수로 값을 갖는다. 최대값은 대수적 중복도 와 관련이 있다.
정리 T T T 의 고유값 λ \lambda λ 의 대수적 중복도를 m m m 이라고 하자. 대수적 중복도는 기하적 중복도보다 크거나 같다.
1 ≤ dim E λ ≤ m
1 \le \dim E_{\lambda} \le m
1 ≤ dim E λ ≤ m
증명 E λ E_{\lambda} E λ 의 순서기저 를 γ = { v 1 , … , v p } \gamma = \left\{ v_{1}, \dots, v_{p} \right\} γ = { v 1 , … , v p } 라고 하자. 이를 확장한 V V V 의 순서기저 를 β = { v 1 , … , v p , v p + 1 , … , v n } \beta = \left\{ v_{1}, \dots, v_{p}, v_{p+1}, \dots, v_{n} \right\} β = { v 1 , … , v p , v p + 1 , … , v n } 이라고 하자. T T T 의 행렬표현 을 A = [ T ] β A = \begin{bmatrix} T \end{bmatrix}_{\beta} A = [ T ] β 라고 하자. 그러면 A A A 는 다음과 같은 블록행렬이다.
A = [ [ T ∣ E λ ] γ B O n − p C ]
A = \begin{bmatrix} \begin{bmatrix} T|_{E_{\lambda}} \end{bmatrix}_{\gamma} & B \\ O_{n-p} & C \end{bmatrix}
A = [ [ T ∣ E λ ] γ O n − p B C ]
O n − p O_{n-p} O n − p 는 n − p × n − p n-p \times n-p n − p × n − p 영행렬 이다. 이때 1 ≤ i ≤ p 1 \le i \le p 1 ≤ i ≤ p 에 대해서, T v i = λ v i Tv_{i} = \lambda v_{i} T v i = λ v i 이므로 T v i Tv_{i} T v i 의 좌표벡터 는 다음과 같다.
[ T v i ] γ = [ 0 ⋮ λ ⋮ 0 ] i -th row
\begin{bmatrix} Tv_{i} \end{bmatrix}_{\gamma} = \begin{bmatrix} 0 \\ \vdots \\ \lambda \\ \vdots \\ 0 \end{bmatrix}i\text{-th row}
[ T v i ] γ = 0 ⋮ λ ⋮ 0 i -th row
따라서, [ T ∣ E λ ] γ = [ [ T v 1 ] γ ⋯ [ T v p ] γ ] \begin{bmatrix} T|_{E_{\lambda}} \end{bmatrix}_{\gamma} = \begin{bmatrix} \begin{bmatrix} Tv_{1} \end{bmatrix}_{\gamma} & \cdots & \begin{bmatrix} Tv_{p} \end{bmatrix}_{\gamma} \end{bmatrix} [ T ∣ E λ ] γ = [ [ T v 1 ] γ ⋯ [ T v p ] γ ] 이므로,
A = [ λ I p B O C ]
A = \begin{bmatrix} \lambda I_{p} & B \\ O & C \end{bmatrix}
A = [ λ I p O B C ]
I p I_{p} I p 는 p × p p \times p p × p 항등행렬 이다.
블록 행렬의 행렬식
A = [ A 1 A 2 O A 3 ] A = \begin{bmatrix} A_{1} & A_{2} \\ O & A_{3} \end{bmatrix} A = [ A 1 O A 2 A 3 ] 를 블록행렬이라고 하자. 그러면 다음이 성립한다.
det A = det A 1 det A 3
\det A = \det A_{1} \det A_{3}
det A = det A 1 det A 3
따라서 T T T 의 특성 다항식 은 다음과 같다.
f ( t ) = det ( A − t I n ) = det [ λ I p − λ I p B O C − t I n − p ] = det ( ( λ − t ) I p ) det ( C − t I n − p ) = ( λ − t ) p det ( C − t I n − p ) = ( − 1 ) p ( t − λ ) p det ( C − t I n − p )
\begin{align*}
f(t) = \det (A - t I_{n})
&= \det \begin{bmatrix} \lambda I_{p} - \lambda I_{p} & B \\ O & C - tI_{n-p} \end{bmatrix} \\
& = \det \left( (\lambda - t)I_{p} \right) \det \left( C - tI_{n-p} \right) \\
& = (\lambda - t)^{p} \det \left( C - tI_{n-p} \right) \\
& = (-1)^{p}(t - \lambda)^{p} \det \left( C - tI_{n-p} \right) \\
\end{align*}
f ( t ) = det ( A − t I n ) = det [ λ I p − λ I p O B C − t I n − p ] = det ( ( λ − t ) I p ) det ( C − t I n − p ) = ( λ − t ) p det ( C − t I n − p ) = ( − 1 ) p ( t − λ ) p det ( C − t I n − p )
이를 보면 ( t − λ ) p (t - \lambda)^{p} ( t − λ ) p 가 특성 다항식 f ( t ) f(t) f ( t ) 의 인수임을 알 수 있다. 따라서 f ( t ) f(t) f ( t ) 는 적어도 λ \lambda λ 를 p p p 중근으로 가지며, 대수적 중복도의 정의에 따라 대수적 중복도는 기하적 중복보다 크거나 같다.
■