양정부호 행렬의 역행렬과 제곱근 행렬
공식 1
양의 정부호 행렬 $A$ 의 고유쌍 $\left\{ \left( \lambda_{k} , e_{k} \right) \right\}_{k=1}^{n}$ 이 $\lambda_{1} > \cdots > \lambda_{n} > 0$ 순으로 정렬되어 있다고 하자. 직교행렬 $P = \begin{bmatrix} e_{1} & \cdots & e_{n} \end{bmatrix} \in \mathbb{R}^{n \times n}$ 와 대각행렬 $\Lambda = \diag \left( \lambda_{1} , \cdots , \lambda_{n} \right)$ 에 대해 $A$ 의 역행렬 $A^{-1}$ 과 제곱근 행렬 $\sqrt{A}$ 은 다음과 같다. $$ \begin{align*} A^{-1} =& P \Lambda^{-1} P^{T} = \sum_{k=1}^{n} {{ 1 } \over { \lambda_{k} }} e_{k} e_{k}^{T} \\ \sqrt{A} =& P \sqrt{\Lambda} P^{T} = \sum_{k=1}^{n} \sqrt{\lambda_{k}} e_{k} e_{k}^{T} \end{align*} $$
유도
스펙트럴 이론: $A$ 가 에르미트 행렬인 것과 유니터리 대각화 가능한 것은 동치다: $$ A = A^{\ast} \iff A = Q \Lambda Q^{\ast} $$
특히 통계학에서, 공분산행렬은 양의 정부호 행렬인 경우가 많고 정부호 행렬은 에르미트행렬이다. 꼭 공분산 행렬이 아니라도 디자인 매트릭스 $X$ 에 대해 $X^{T} X$ 는 대칭행렬, 특히 $X \in \mathbb{R}^{m \times n}$ 이면 또 다시 에르미트행렬이 된다. 이런 조건 하에서 $A$ 는 스펙트럴 이론에 따라 정규직교 고유벡터 $e_{1} , \cdots , e_{n}$ 들로 이루어진 $Q$ 를 얻을 수 있고, 다시 적어보면 다음과 같다. $$ \begin{align*} & A \\ = & Q \Lambda Q^{\ast} \\ = & Q \begin{bmatrix} \lambda_{1} & 0 & \cdots & 0 \\ 0 & \lambda_{2} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_{n} \end{bmatrix} \begin{bmatrix} e_{1}^{\ast} \\ e_{2}^{\ast} \\ \vdots \\ e_{n}^{\ast} \end{bmatrix} \\ = & \begin{bmatrix} e_{1} & e_{2} & \cdots & e_{n} \end{bmatrix} \begin{bmatrix} \lambda_{1} e_{1}^{\ast} \\ \lambda_{2} e_{2}^{\ast} \\ \vdots \\ \lambda_{n} e_{n}^{\ast} \end{bmatrix} \\ = & \lambda_{1} e_{1} e_{1}^{\ast} + \lambda_{2} e_{2} e_{2}^{\ast} + \cdots + \lambda_{n} e_{n} e_{n}^{\ast} \\ = & \sum_{k=1}^{n} \lambda_{k} e_{k} e_{k}^{\ast} \end{align*} $$
$\Lambda$ 가 대각행렬이라 특별히 유도랄 것도 없다. $P$ 가 직교행렬이므로 $$ \begin{align*} A^{-1} =& \left( P \Lambda P^{T} \right)^{-1} \\ =& P^{-T} \Lambda^{-1} P^{-1} \\ =& P \Lambda^{-1} P^{T} \end{align*} $$ 이고, 항등행렬 $I$ 에 대해서 다음과 같은 검산으로 $\sqrt{A}$ 를 얻는다. $$ \begin{align*} & \left( P \sqrt{\Lambda} P^{T} \right) \left( P \sqrt{\Lambda} P^{T} \right) \\ =& P \sqrt{\Lambda} P^{T} P \sqrt{\Lambda} P^{T} \\ =& P \sqrt{\Lambda} I \sqrt{\Lambda} P^{T} \\ =& P \sqrt{\Lambda} \sqrt{\Lambda} P^{T} \\ =& P \Lambda P^{T} \\ =& A \end{align*} $$
■
Johnson. (2013). Applied Multivariate Statistical Analysis(6th Edition): p104. ↩︎