logo

行列代数における射影 📂行列代数

行列代数における射影

定義

射影が$P \in \mathbb{C}^{m \times m}$が$\mathcal{C} (P) ^{\perp} = \mathcal{N} (P)$を満たすなら、$P$を直交射影という。

説明

射影の性質$\mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P)$に従って、$P$は$\mathbb{C}^{m}$をちょうど二つの部分空間$\mathcal{C} (P)$と$\mathcal{N} (P)$に分割することがわかる。

この分割が条件$\mathcal{N} (P) = \mathcal{C} (P) ^{\perp}$を満たすとは、線形変換$P$の零空間$\mathcal{N} (P)$が列空間$\mathcal{C} (P)$の直交補空間であるという意味であり、単なる分割ではなく直交性を含む分割であることがわかる。その意味で、直交射影の定義はかなり妥当だと言えるだろう。

また、線形変換$P$が直交射影となるための必要十分条件は、$P$がエルミート行列であることだ。

その証明は思ったより難しくて汚いので、勉強するときは事実としてだけ覚えておくことをお勧めする。

定理

$$ \mathcal{C} (P) ^{\perp} = \mathcal{N} (P) \iff P = P^{\ast} $$

証明

$(\Longrightarrow)$

$\mathbb{C}^{m}$の正規直交基底が$\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{m} \right\}$のとき$\dim \mathcal{C} (P) = r$とし、$\mathcal{C} (P)$の正規直交基底は$\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\}$とすることができる。$\left\{ \mathbf{q}_{1} , \cdots , \mathbf{q}_{r} \right\}$は$\mathcal{C} (P)$の基底なので、$\mathbf{q}_{i} = P \mathbf{v}$を満たす何らかの$\mathbf {v}$が存在するだろうし、この式に$P$をかけると

$$ P \mathbf{q}_{i} = PP \mathbf{v} = P \mathbf{v} = \mathbf{q}_{i} $$

一方$\mathbb{C}^{m} = \mathcal{C} (P) \oplus \mathcal{N} (P)$であるから、$\mathcal{N} (P)$の正規直交基底は$\left\{ \mathbf{q}_{r +1} , \cdots , \mathbf{q}_{m} \right\}$になるだろう。$\left\{ \mathbf{q}_ {1} , \cdots , \mathbf{q}_{r} \right\}$のベクトルで行列$Q : = \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m} \end{bmatrix}$を構成すると、$Q$はユニタリ行列になり、$PQ$を計算すると

$$ \begin{align*} PQ =& P\begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbf{q}_{r+1} & \cdots & \mathbf{q}_{m} \end{bmatrix} \\ =& \begin{bmatrix} P \mathbf{q}_{1} & \cdots & P \mathbf{q}_{r} & P \mathbf{q}_{r+1} & \cdots & P \mathbf{q}_{m} \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} & \mathbb{0} & \cdots & \mathbb{0} \end{bmatrix} \end{align*} $$

便宜上$\widehat{Q} := \begin{bmatrix} \mathbf{q}_{1} & \cdots & \mathbf{q}_{r} \end{bmatrix}$とすると、$PQ = \begin{bmatrix} \widehat{Q} & O \end{bmatrix}$と表せる。上で得た式に$Q^{\ast}$をかけると

$$ \begin{align*} Q^{\ast} P Q =& \begin{bmatrix} \widehat{Q}^{\ast} \\ \mathbf{q}_{r+1} \\ \vdots \\ \mathbf{q}_{m} \end{bmatrix} \begin{bmatrix} \widehat{Q} & O \end{bmatrix} \\ =& \begin{bmatrix} \widehat{Q}^{\ast} \widehat{Q} & O \\ O & O \end{bmatrix} \\ =& \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} \end{align*} $$

$P$ 에 대해서 정리하면

$$ P = Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast} $$

이고

$$ P^{\ast} = \left( Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast} \right)^{\ast} = Q \begin{bmatrix} I_{r} & O \\ O & O \end{bmatrix} Q^{\ast} = P $$

이므로 $P$ 는 에르미트 행렬이다.

$(\Longleftarrow)$

$\mathbb{C}^{m } = \mathcal{C} (P) \oplus \mathcal{N} (P)$ 에서 $\mathcal{N} (P) = \mathcal{C} (I-P)$ 이다. 두 벡터 $P \mathbb{x} \in \mathcal{C} (P)$ 와 $(I - P) \mathbb{y} \in \mathcal{C} (I - P)$の内積を計算すると

$$ \begin{align*} ( P \mathbb{x} )^{\ast} (I - P) \mathbb{y} =& \mathbb{x}^{\ast} P^{\ast} ( I - P ) \mathbb{y} \\ =& \mathbb{x}^{\ast} P ( I - P ) \mathbb{y} \\ =& \mathbb{x}^{\ast} ( P - P^2 ) \mathbb{y} \\ =& \mathbb{x}^{\ast} ( P - P ) \mathbb{y} \\ =& \mathbb{0} \end{align*} $$

従って、

$$ \mathcal{C} (P) = \mathcal{C} (I-P)^{\perp} = \mathcal{N} (P)^{\perp} $$