행렬대수에서 정사영이란
📂행렬대수 행렬대수에서 정사영이란 정의 사영 P ∈ C m × m P \in \mathbb{C}^{m \times m} P ∈ C m × m 가 C ( P ) ⊥ = N ( P ) \mathcal{C} (P) ^{\perp} = \mathcal{N} (P) C ( P ) ⊥ = N ( P ) 를 만족하면 P P P 를 정사영 이라 한다.
설명 사영의 성질 C m = C ( P ) ⊕ N ( P ) \mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P) C m = C ( P ) ⊕ N ( P ) 에 따라 P P P 는 C m \mathbb{C}^{m} C m 을 정확히 두 개의 부분공간 C ( P ) \mathcal{C} (P) C ( P ) 과 N ( P ) \mathcal{N} (P) N ( P ) 으로 분할함을 알 수 있다.
이 분할에서 조건 N ( P ) = C ( P ) ⊥ \mathcal{N} (P) = \mathcal{C} (P) ^{\perp} N ( P ) = C ( P ) ⊥ 을 만족한다는 것은 일차변환 P P P 의 영공간 N ( P ) \mathcal{N} (P) N ( P ) 가 열공간 C ( P ) \mathcal{C} (P) C ( P ) 의 직교여공간이라는 뜻이므로 그냥 분할이 아니라 수직성이 포함되는 분할임을 알 수 있고, 그런 센스에서 정사영의 정의는 상당히 타당하다고 할 수 있겠다.
한편 일차변환 P P P 가 정사영이 되기 위한 필요충분조건은 P P P 가 에르미트 행렬인 것이다.
그 증명은 생각보다 어렵고 지저분하므로 공부할 때는 팩트로써만 알아둘 것을 권장한다.
정리 C ( P ) ⊥ = N ( P ) ⟺ P = P ∗
\mathcal{C} (P) ^{\perp} = \mathcal{N} (P) \iff P = P^{\ast}
C ( P ) ⊥ = N ( P ) ⟺ P = P ∗
증명 ( ⟹ ) (\Longrightarrow) ( ⟹ )
C m \mathbb{C}^{m} C m 의 정규직교기저가 { q 1 , ⋯ , q m } \left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{m} \right\} { q 1 , ⋯ , q m } 일 때 dim C ( P ) = r \dim \mathcal{C} (P) = r dim C ( P ) = r 이라고 하면 C ( P ) \mathcal{C} (P) C ( P ) 의 정규직교기저는 { q 1 , ⋯ , q r } \left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\} { q 1 , ⋯ , q r } 로 둘 수 있다. { q 1 , ⋯ , q r } \left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\} { q 1 , ⋯ , q r } 는 C ( P ) \mathcal{C} (P) C ( P ) 의 기저이므로 q i = P v \mathbf{q}_{i} = P \mathbf{v} q i = P v 를 만족시키는 어떤 v \mathbf {v} v 가 존재할 것이고, 이 식에 P P P 를 곱하면
P q i = P P v = P v = q i
P \mathbf{q}_{i} = PP \mathbf{v} = P \mathbf{v} = \mathbf{q}_{i}
P q i = PP v = P v = q i
한편 C m = C ( P ) ⊕ N ( P ) \mathbb{C}^{m} = \mathcal{C} (P) \oplus \mathcal{N} (P) C m = C ( P ) ⊕ N ( P ) 이므로 N ( P ) \mathcal{N} (P) N ( P ) 의 정규직교기저는 { q r + 1 , ⋯ , q m } \left\{ \mathbf{q}_{r +1} , \cdots , \mathbf{q}_{m} \right\} { q r + 1 , ⋯ , q m } 이 될 것이다. { q 1 , ⋯ , q r } \left\{ \mathbf{q}_ {1} , \cdots , \mathbf{q}_{r} \right\} { q 1 , ⋯ , q r } 의 벡터로 행렬 Q : = [ q 1 ⋯ q r q r + 1 ⋯ q m ] Q : = \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m} \end{bmatrix} Q := [ q 1 ⋯ q r q r + 1 ⋯ q m ] 을 구성하면 Q Q Q 는 유니터리 행렬 이 되고, P Q PQ PQ 를 계산하면
P Q = P [ q 1 ⋯ q r q r + 1 ⋯ q m ] = [ P q 1 ⋯ P q r P q r + 1 ⋯ P q m ] = [ q 1 ⋯ q r 0 ⋯ 0 ]
\begin{align*}
PQ =& P\begin{bmatrix}
\mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m}
\end{bmatrix}
\\ =& \begin{bmatrix}
P \mathbf{q}_{1} & \cdots & P \mathbf{q}_{r} & P \mathbf{q}_{r+1} & \cdots & P \mathbf{q}_{m}
\end{bmatrix}
\\ &= \begin{bmatrix}
\mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbb{0} & \cdots & \mathbb{0}
\end{bmatrix}
\end{align*}
PQ = = P [ q 1 ⋯ q r q r + 1 ⋯ q m ] [ P q 1 ⋯ P q r P q r + 1 ⋯ P q m ] = [ q 1 ⋯ q r 0 ⋯ 0 ]
편의상 Q ^ : = [ q 1 ⋯ q r ] \widehat{Q} := \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} \end{bmatrix} Q := [ q 1 ⋯ q r ] 이라고 하면 P Q = [ Q ^ O ] PQ = \begin{bmatrix} \widehat{Q} & O \end{bmatrix} PQ = [ Q O ] 로 나타낼 수 있다. 위에서 얻은 식에 Q ∗ Q^{\ast} Q ∗ 를 곱하면
Q ∗ P Q = [ Q ^ ∗ q r + 1 ⋮ q m ] [ Q ^ O ] = [ Q ^ ∗ Q ^ O O O ] = [ I r O O O ]
\begin{align*}
Q^{\ast} P Q =& \begin{bmatrix}
\widehat{Q}^{\ast}
\\ \mathbf{q}_{r+1}
\\ \vdots
\\ \mathbf{q}_{m}
\end{bmatrix} \begin{bmatrix}
\widehat{Q} & O
\end{bmatrix}
\\ =& \begin{bmatrix}
\widehat{Q}^{\ast} \widehat{Q} & O
\\ O & O
\end{bmatrix}
\\ =& \begin{bmatrix}
I_{r} & O
\\ O & O
\end{bmatrix}
\end{align*}
Q ∗ PQ = = = Q ∗ q r + 1 ⋮ q m [ Q O ] [ Q ∗ Q O O O ] [ I r O O O ]
P P P 에 대해서 정리하면
P = Q [ I r O O O ] Q ∗
P = Q \begin{bmatrix}
I_{r} & O
\\ O & O
\end{bmatrix} Q^{\ast}
P = Q [ I r O O O ] Q ∗
이고
P ∗ = ( Q [ I r O O O ] Q ∗ ) ∗ = Q [ I r O O O ] Q ∗ = P
P^{\ast} = \left( Q \begin{bmatrix}
I_{r} & O
\\ O & O
\end{bmatrix} Q^{\ast} \right)^{\ast} = Q \begin{bmatrix}
I_{r} & O
\\ O & O
\end{bmatrix} Q^{\ast} = P
P ∗ = ( Q [ I r O O O ] Q ∗ ) ∗ = Q [ I r O O O ] Q ∗ = P
이므로 P P P 는 에르미트 행렬이다.
( ⟸ ) (\Longleftarrow) ( ⟸ )
C m = C ( P ) ⊕ N ( P ) \mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P) C m = C ( P ) ⊕ N ( P ) 에서 N ( P ) = C ( I − P ) \mathcal{N} (P) = \mathcal{C} (I-P) N ( P ) = C ( I − P ) 이다. 두 벡터 P x ∈ C ( P ) P \mathbf{x} \in \mathcal{C} (P) P x ∈ C ( P ) 와 ( I − P ) y ∈ C ( I − P ) (I - P) \mathbf{y} \in \mathcal{C} (I - P) ( I − P ) y ∈ C ( I − P ) 의 내적을 계산해보면
( P x ) ∗ ( I − P ) y = x ∗ P ∗ ( I − P ) y = x ∗ P ( I − P ) y = x ∗ ( P − P 2 ) y = x ∗ ( P − P ) y = 0
\begin{align*}
( P \mathbf{x} )^{\ast} (I - P) \mathbf{y} =& \mathbf{x}^{\ast} P^{\ast} ( I - P ) \mathbf{y}
\\ =& \mathbf{x}^{\ast} P ( I - P ) \mathbf{y}
\\ =& \mathbf{x}^{\ast} ( P - P^2 ) \mathbf{y}
\\ =& \mathbf{x}^{\ast} ( P - P ) \mathbf{y}
\\ =& \mathbb{0}
\end{align*}
( P x ) ∗ ( I − P ) y = = = = = x ∗ P ∗ ( I − P ) y x ∗ P ( I − P ) y x ∗ ( P − P 2 ) y x ∗ ( P − P ) y 0
따라서
C ( P ) = C ( I − P ) ⊥ = N ( P ) ⊥
\mathcal{C} (P) = \mathcal{C} (I-P)^{\perp} = \mathcal{N} (P)^{\perp}
C ( P ) = C ( I − P ) ⊥ = N ( P ) ⊥
■