행렬의 직합
📂행렬대수 행렬의 직합 정의 두 행렬 B ∈ M m × n B \in M_{m\times n} B ∈ M m × n , C ∈ M p × q C \in M_{p\times q} C ∈ M p × q 의 직합 direct sum 을 다음과 같은 ( m + p ) × ( n + q ) (m+p) \times (n+q) ( m + p ) × ( n + q ) 행렬 A A A 로 정의하고, B ⊕ C B \oplus C B ⊕ C 라 표기한다.
A = B ⊕ C : = [ b 11 ⋯ b 1 n 0 ⋯ 0 ⋮ ⋱ ⋮ ⋮ ⋱ ⋮ b m 1 ⋯ b m n 0 ⋯ 0 0 ⋯ 0 c 11 ⋯ c 1 q ⋮ ⋱ ⋮ ⋮ ⋱ ⋮ 0 ⋯ 0 c p 1 ⋯ c p q ]
A = B \oplus C := \begin{bmatrix}
b_{11} & \cdots & b_{1n} & 0 & \cdots & 0 \\
\vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\
b_{m1} & \cdots & b_{mn} & 0 & \cdots & 0 \\
0 & \cdots & 0 & c_{11} & \cdots & c_{1q} \\
\vdots & \ddots & \vdots & \vdots & \ddots & \vdots \\
0 & \cdots & 0 & c_{p1} & \cdots & c_{pq} \\
\end{bmatrix}
A = B ⊕ C := b 11 ⋮ b m 1 0 ⋮ 0 ⋯ ⋱ ⋯ ⋯ ⋱ ⋯ b 1 n ⋮ b mn 0 ⋮ 0 0 ⋮ 0 c 11 ⋮ c p 1 ⋯ ⋱ ⋯ ⋯ ⋱ ⋯ 0 ⋮ 0 c 1 q ⋮ c pq
A i j : = { [ B ] i j for 1 ≤ i ≤ m , 1 ≤ j ≤ n [ C ] ( i − m ) , ( j − n ) for m + 1 ≤ i ≤ p + m , n + 1 ≤ j ≤ q + n 0 otherwise
A_{ij} := \begin{cases}
[B]_{ij} & \text{for } 1\le i \le m,\ 1\le j \le n \\
[C]_{(i-m),(j-n)} & \text{for } m+1\le i \le p+m,\ n+1\le j \le q+n \\
0 & \text{otherwise}
\end{cases}
A ij := ⎩ ⎨ ⎧ [ B ] ij [ C ] ( i − m ) , ( j − n ) 0 for 1 ≤ i ≤ m , 1 ≤ j ≤ n for m + 1 ≤ i ≤ p + m , n + 1 ≤ j ≤ q + n otherwise
블록행렬 꼴로 나타내면,
A = [ B O m q O p n C ]
A = \begin{bmatrix}
B & O_{mq} \\ O_{pn} & C
\end{bmatrix}
A = [ B O p n O m q C ]
이때 O O O 는 영행렬 이다.
일반화 행렬 B 1 , B 2 , … , B k B_{1}, B_{2}, \dots, B_{k} B 1 , B 2 , … , B k 의 직합 을 다음과 같이 재귀적으로recursively 정의한다.
B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k : = ( B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k − 1 ) ⊕ B k
B_{1} \oplus B_{2} \oplus \cdots \oplus B_{k} := (B_{1} \oplus B_{2} \oplus \cdots \oplus B_{k-1}) \oplus B_{k}
B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k := ( B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k − 1 ) ⊕ B k
A = B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k A = B_{1} \oplus B_{2} \oplus \cdots \oplus B_{k} A = B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k 이면,
A = [ B 1 O ⋯ O O B 2 ⋯ O ⋮ ⋮ ⋱ ⋮ O O ⋯ B k ]
A = \begin{bmatrix}
B_{1} & O & \cdots & O \\
O & B_{2} & \cdots & O \\
\vdots & \vdots & \ddots & \vdots \\
O & O & \cdots & B_{k} \\
\end{bmatrix}
A = B 1 O ⋮ O O B 2 ⋮ O ⋯ ⋯ ⋱ ⋯ O O ⋮ B k
설명 쉽게 말해서 행렬들로 블록대각행렬 을 만드는 것이다.
B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k = diag [ B 1 B 2 ⋮ B k ]
B_{1} \oplus B_{2} \oplus \cdots \oplus B_{k} = \href{../2048}{\diag} \begin{bmatrix}
B_{1} \\ B_{2} \\ \vdots \\ B_{k}
\end{bmatrix}
B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k = diag B 1 B 2 ⋮ B k
구체적인 예로 B 1 = [ 1 1 1 1 1 1 ] B_{1} = \begin{bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \end{bmatrix} B 1 = [ 1 1 1 1 1 1 ] , B 2 = [ 2 ] B_{2} = \begin{bmatrix} 2 \end{bmatrix} B 2 = [ 2 ] , B 3 = [ 3 3 3 3 3 3 3 3 3 ] B_{3} = \begin{bmatrix} 3 & 3 & 3 \\ 3 & 3 & 3 \\ 3 & 3 & 3 \end{bmatrix} B 3 = 3 3 3 3 3 3 3 3 3 이라 하면,
B 1 ⊕ B 2 ⊕ B 3 = [ 1 1 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 3 3 3 0 0 0 0 3 3 3 0 0 0 0 3 3 3 ]
B_{1} \oplus B_{2} \oplus B_{3} =
\begin{bmatrix}
1 & 1 & 1 & 0 & 0 & 0 & 0 \\
1 & 1 & 1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 2 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 3 & 3 & 3 \\
0 & 0 & 0 & 0 & 3 & 3 & 3 \\
0 & 0 & 0 & 0 & 3 & 3 & 3
\end{bmatrix}
B 1 ⊕ B 2 ⊕ B 3 = 1 1 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 2 0 0 0 0 0 0 3 3 3 0 0 0 3 3 3 0 0 0 3 3 3
보통의 경우에 행렬의 직합보다 부분공간의 직합 을 먼저 접할텐데, 아래의 정리를 보면 이러한 정의가 왜 직합으로 불리는지 충분히 납득할 수 있다. 선형변환 T : V → V T : V \to V T : V → V 가 주어졌을 때 V = W 1 ⊕ ⋯ ⊕ W k V = W_{1} \oplus \cdots \oplus W_{k} V = W 1 ⊕ ⋯ ⊕ W k 이면, T T T 의 행렬표현 은 축소사상 T ∣ W i T|_{W_{i}} T ∣ W i 의 행렬표현들의 직합으로 나타나므로, 이러한 행렬의 연산을 직합이라 부르지 않을 이유가 없다.
정리 T : V → V T : V \to V T : V → V 를 유한차원 벡터공간 V V V 위의 선형변환 이라고 하자. W 1 , … , W k W_{1}, \dots, W_{k} W 1 , … , W k 를 T T T -불변 부분공간 , V V V 를 W i W_{i} W i 들의 직합 이라 하자.
V = W 1 ⊕ ⋯ ⊕ W k
V = W_{1} \oplus \cdots \oplus W_{k}
V = W 1 ⊕ ⋯ ⊕ W k
β i \beta_{i} β i 를 W i W_{i} W i 의 순서기저 , β = β 1 ∪ ⋯ ∪ β k \beta = \beta_{1} \cup \cdots \cup \beta_{k} β = β 1 ∪ ⋯ ∪ β k 라고 하자.(그러면 β \beta β 는 V V V 의 기저이다 ) 그리고 A = [ T ] β A = \begin{bmatrix} T \end{bmatrix}_{\beta} A = [ T ] β , B i = [ T ∣ W ] β i B_{i} = \begin{bmatrix} T|_{W}\end{bmatrix}_{\beta_{i}} B i = [ T ∣ W ] β i 라 하면, 다음이 성립한다.
A = B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k = [ B 1 O ⋯ O O B 2 ⋯ O ⋮ ⋮ ⋱ ⋮ O O ⋯ B k ]
A = B_{1} \oplus B_{2} \oplus \cdots \oplus B_{k} =
\begin{bmatrix}
B_{1} & O & \cdots & O \\
O & B_{2} & \cdots & O \\
\vdots & \vdots & \ddots & \vdots \\
O & O & \cdots & B_{k} \\
\end{bmatrix}
A = B 1 ⊕ B 2 ⊕ ⋯ ⊕ B k = B 1 O ⋮ O O B 2 ⋮ O ⋯ ⋯ ⋱ ⋯ O O ⋮ B k
증명 수학적 귀납법으로 증명한다.
k = 2 k=2 k = 2 일 때 성립한다.
v ∈ β 1 \mathbf{v} \in \beta_{1} v ∈ β 1 이라 하자. β \beta β 가 V V V 의 기저 이므로, T v ∈ V T \mathbf{v} \in V T v ∈ V 는 β \beta β 의 선형결합 으로 표현된다. 그런데 W 1 W_{1} W 1 가 불변부분공간이므로, T v ∈ W 1 T \mathbf{v} \in W_{1} T v ∈ W 1 이다. 따라서 T v T \mathbf{v} T v 의 선형결합에서 β 2 \beta_{2} β 2 의 원소의 계수는 모두 0 0 0 이다. 이는, n = dim ( W 1 ) n = \dim(W_{1}) n = dim ( W 1 ) 일 때, 좌표벡터 [ T v ] β \begin{bmatrix} T \mathbf{v} \end{bmatrix}_{\beta} [ T v ] β 의 성분이 n + 1 n+1 n + 1 번째 이후로는 모두 0 0 0 임을 의미한다. 따라서,
[ T ∣ W 1 v ] β 1 = [ b 1 ⋮ b n ] and [ T v ] β = [ b 1 ⋮ b n 0 ⋮ 0 ]
\begin{bmatrix} T|_{W_{1}}\mathbf{v}\end{bmatrix}_{\beta_{1}} = \begin{bmatrix} b_{1} \\ \vdots \\ b_{n} \end{bmatrix} \quad \text{and} \quad \begin{bmatrix} T \mathbf{v} \end{bmatrix}_{\beta} = \begin{bmatrix} b_{1} \\ \vdots \\ b_{n} \\ 0 \\ \vdots \\ 0 \end{bmatrix}
[ T ∣ W 1 v ] β 1 = b 1 ⋮ b n and [ T v ] β = b 1 ⋮ b n 0 ⋮ 0
마찬가지로 v ∈ β 2 \mathbf{v} \in \beta_{2} v ∈ β 2 , m = dim ( W 2 ) m = \dim(W_{2}) m = dim ( W 2 ) 라면, T v ∈ W 2 T \mathbf{v} \in W_{2} T v ∈ W 2 이고 좌표벡터는 다음과 같다.
[ T ∣ W 2 v ] β 2 = [ b n + 1 ⋮ b n + m ] and [ T v ] β = [ 0 ⋮ 0 b n + 1 ⋮ b n + m ]
\begin{bmatrix} T|_{W_{2}}\mathbf{v}\end{bmatrix}_{\beta_{2}} = \begin{bmatrix} b_{n+1} \\ \vdots \\ b_{n+m} \end{bmatrix} \quad \text{and} \quad \begin{bmatrix} T \mathbf{v} \end{bmatrix}_{\beta} = \begin{bmatrix} 0 \\ \vdots \\ 0 \\ b_{n+1} \\ \vdots \\ b_{n+m} \end{bmatrix}
[ T ∣ W 2 v ] β 2 = b n + 1 ⋮ b n + m and [ T v ] β = 0 ⋮ 0 b n + 1 ⋮ b n + m
따라서,
[ T ] β = [ [ T ∣ W 1 ] β 1 O O [ T ∣ W 2 ] β 2 ]
\begin{bmatrix} T \end{bmatrix}_{\beta} = \begin{bmatrix}
\begin{bmatrix} T|_{W_{1}}\end{bmatrix}_{\beta_{1}} & O \\ O & \begin{bmatrix} T|_{W_{2}}\end{bmatrix}_{\beta_{2}}
\end{bmatrix}
[ T ] β = [ [ T ∣ W 1 ] β 1 O O [ T ∣ W 2 ] β 2 ]
k − 1 k-1 k − 1 일 때 성립하면, k k k 일 때도 성립한다.
W = W 1 ⊕ ⋯ ⊕ W k − 1 W = W_{1} \oplus \cdots \oplus W_{k-1} W = W 1 ⊕ ⋯ ⊕ W k − 1 , β W = β 1 ∪ ⋯ ∪ β k − 1 \beta_{W} = \beta_{1} \cup \cdots \cup \beta_{k-1} β W = β 1 ∪ ⋯ ∪ β k − 1 라고 하자. k − 1 k-1 k − 1 일 때 성립한다고 가정했으므로,
[ T ∣ W ] β W = [ [ T ∣ W 1 ] β 1 ⋯ O ⋮ ⋱ ⋮ O ⋯ [ T ∣ W k − 1 ] β k − 1 ]
\begin{bmatrix} T|_{W} \end{bmatrix}_{\beta_{W}} =
\begin{bmatrix}
\begin{bmatrix} T|_{W_{1}}\end{bmatrix}_{\beta_{1}} & \cdots & O \\ \vdots & \ddots & \vdots \\ O &\cdots & \begin{bmatrix} T|_{W_{k-1}}\end{bmatrix}_{\beta_{k-1}}
\end{bmatrix}
[ T ∣ W ] β W = [ T ∣ W 1 ] β 1 ⋮ O ⋯ ⋱ ⋯ O ⋮ [ T ∣ W k − 1 ] β k − 1
그런데 V = W ⊕ W k V = W \oplus W_{k} V = W ⊕ W k , β = β W ∪ β k \beta = \beta_{W} \cup \beta_{k} β = β W ∪ β k 이고 k = 2 k=2 k = 2 일 때 성립하므로,
[ T ] β = [ [ T ∣ W ] β W O O [ T ∣ W k ] β k ] = [ [ T ∣ W 1 ] β 1 ⋯ O O ⋮ ⋱ ⋮ ⋮ O ⋯ [ T ∣ W k − 1 ] β k − 1 O O ⋯ O [ T ∣ W k ] β k ]
\begin{bmatrix} T \end{bmatrix}_{\beta} = \begin{bmatrix}
\begin{bmatrix} T|_{W}\end{bmatrix}_{\beta_{W}} & O \\ O & \begin{bmatrix} T|_{W_{k}}\end{bmatrix}_{\beta_{k}}
\end{bmatrix} =
\begin{bmatrix}
\begin{bmatrix}
T|_{W_{1}}\end{bmatrix}_{\beta_{1}} & \cdots & O & O \\
\vdots & \ddots & \vdots & \vdots \\
O & \cdots & \begin{bmatrix} T|_{W_{k-1}}\end{bmatrix}_{\beta_{k-1}} & O \\
O & \cdots & O & \begin{bmatrix} T|_{W_{k}}\end{bmatrix}_{\beta_{k}} \\
\end{bmatrix}
[ T ] β = [ [ T ∣ W ] β W O O [ T ∣ W k ] β k ] = [ T ∣ W 1 ] β 1 ⋮ O O ⋯ ⋱ ⋯ ⋯ O ⋮ [ T ∣ W k − 1 ] β k − 1 O O ⋮ O [ T ∣ W k ] β k
■