행렬대수에서 정사영이란 📂행렬대수

행렬대수에서 정사영이란

정의

사영 $P \in \mathbb{C}^{m \times m}$ 가 $\mathcal{C} (P) ^{\perp} = \mathcal{N} (P)$ 를 만족하면 $P$ 를 정사영이라 한다.

설명

사영의 성질 $\mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P)$ 에 따라 $P$ 는 $\mathbb{C}^{m}$ 을 정확히 두 개의 부분공간 $\mathcal{C} (P)$ 과 $\mathcal{N} (P)$ 으로 분할함을 알 수 있다.

이 분할에서 조건 $\mathcal{N} (P) = \mathcal{C} (P) ^{\perp}$ 을 만족한다는 것은 일차변환 $P$ 의 영공간 $\mathcal{N} (P)$ 가 열공간 $\mathcal{C} (P)$ 의 직교여공간이라는 뜻이므로 그냥 분할이 아니라 수직성이 포함되는 분할임을 알 수 있고, 그런 센스에서 정사영의 정의는 상당히 타당하다고 할 수 있겠다.

한편 일차변환 $P$ 가 정사영이 되기 위한 필요충분조건은 $P$ 가 에르미트 행렬인 것이다.

그 증명은 생각보다 어렵고 지저분하므로 공부할 때는 팩트로써만 알아둘 것을 권장한다.

정리

$\mathcal{C} (P) ^{\perp} = \mathcal{N} (P) \iff P = P^{\ast}$

증명

$(\Longrightarrow)$

$\mathbb{C}^{m}$ 의 정규직교기저가 $\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{m} \right\}$ 일 때 $\dim \mathcal{C} (P) = r$ 이라고 하면 $\mathcal{C} (P)$ 의 정규직교기저는 $\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\}$ 로 둘 수 있다. $\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\}$ 는 $\mathcal{C} (P)$ 의 기저이므로 $\mathbf{q}_{i} = P \mathbf{v}$ 를 만족시키는 어떤 $\mathbf {v}$ 가 존재할 것이고, 이 식에 $P$ 를 곱하면

$P \mathbf{q}_{i} = PP \mathbf{v} = P \mathbf{v} = \mathbf{q}_{i}$

한편 $\mathbb{C}^{m} = \mathcal{C} (P) \oplus \mathcal{N} (P)$ 이므로 $\mathcal{N} (P)$ 의 정규직교기저는 $\left\{ \mathbf{q}_{r +1} , \cdots , \mathbf{q}_{m} \right\}$ 이 될 것이다. $\left\{ \mathbf{q}_ {1} , \cdots , \mathbf{q}_{r} \right\}$ 의 벡터로 행렬 $Q : = \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m} \end{bmatrix}$ 을 구성하면 $Q$ 는 유니터리 행렬이 되고, $PQ$ 를 계산하면

$\begin{align*} PQ =& P\begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m} \end{bmatrix} \\ =& \begin{bmatrix} P \mathbf{q}_{1} & \cdots & P \mathbf{q}_{r} & P \mathbf{q}_{r+1} & \cdots & P \mathbf{q}_{m} \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbb{0} & \cdots & \mathbb{0} \end{bmatrix} \end{align*}$

편의상 $\widehat{Q} := \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} \end{bmatrix}$ 이라고 하면 $PQ = \begin{bmatrix} \widehat{Q} & O \end{bmatrix}$ 로 나타낼 수 있다. 위에서 얻은 식에 $Q^{\ast}$ 를 곱하면

$\begin{align*} Q^{\ast} P Q =& \begin{bmatrix} \widehat{Q}^{\ast} \\ \mathbf{q}_{r+1} \\ \vdots \\ \mathbf{q}_{m} \end{bmatrix} \begin{bmatrix} \widehat{Q} & O \end{bmatrix} \\ =& \begin{bmatrix} \widehat{Q}^{\ast} \widehat{Q} & O \\ O & O \end{bmatrix} \\ =& \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} \end{align*}$

$P$ 에 대해서 정리하면

$P = Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast}$

이고

$P^{\ast} = \left( Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast} \right)^{\ast} = Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast} = P$

이므로 $P$ 는 에르미트 행렬이다.

$(\Longleftarrow)$

$\mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P)$ 에서 $\mathcal{N} (P) = \mathcal{C} (I-P)$ 이다. 두 벡터 $P \mathbf{x} \in \mathcal{C} (P)$ 와 $(I - P) \mathbf{y} \in \mathcal{C} (I - P)$ 의 내적을 계산해보면

$\begin{align*} ( P \mathbf{x} )^{\ast} (I - P) \mathbf{y} =& \mathbf{x}^{\ast} P^{\ast} ( I - P ) \mathbf{y} \\ =& \mathbf{x}^{\ast} P ( I - P ) \mathbf{y} \\ =& \mathbf{x}^{\ast} ( P - P^2 ) \mathbf{y} \\ =& \mathbf{x}^{\ast} ( P - P ) \mathbf{y} \\ =& \mathbb{0} \end{align*}$

따라서

$\mathcal{C} (P) = \mathcal{C} (I-P)^{\perp} = \mathcal{N} (P)^{\perp}$

■