logo

행렬의 로그 📂행렬대수

행렬의 로그

도입1

행렬의 지수함수는 아래와 같이 테일러 급수 꼴로 정의된다. 행렬 $X \in M_{n \times n}(\mathbb{C})$에 대해서,

$$ e^{X} = \sum\limits_{m=0}^{\infty} \dfrac{X^{m}}{m!} $$

이와 마찬가지로, 행렬의 로그함수도 급수 꼴로 정의한다. 로그함수의 테일러 급수는 아래와 같다.

$$ \log z = \sum\limits_{m=1}^{\infty} (-1)^{m+1}\dfrac{(z-1)^{m}}{m}, \qquad |z-1| \lt 1 \tag{1} $$

정의

$n \times n$ 행렬 $A$에 대해서, 아래의 급수가 수렴하면 이를 $\log A$라 정의한다.

$$ \log A = \sum\limits_{m=1}^{\infty} (-1)^{m+1} \dfrac{(A - I)^{m}}{m} \tag{2} $$

설명

$(1)$의 급수가 $| z - 1 | \lt 1$일 때 수렴하는 것처럼, $\log A$ 역시 $\| A - I \| \lt 1$일 때 수렴한다. 단, 이는 충분조건이므로 $\| A - I \| \lt 1$일 때만 수렴한다는 의미는 아니다. 예를들어 $\| A - I \| \gt 1$이더라도 $A - I$가 멱영행렬이면 수렴한다.

행렬 지수와 마찬가지로, $A \in M_{n \times n}(\mathbb{C})$이면 $\log A$ 자체도 $M_{n \times n}(\mathbb{C})$에 포함된 행렬이다.

(c) 의 결과에 주의해야하는데, $\log (e^{X})$가 수렴한다고 해서 그 값이 $X$와 같다는 것이 보장되지 않는다. 반례로 $X = 2\pi i I$로 두면, $e^{X} = e^{2\pi i} I = I$이다. 따라서 $e^{X} - I = O$이고 $\log (e^{X}) = O$이다. 즉 이 경우에는 $X \ne \log (e^{X})$이다.

(d) 로부터 다음을 얻는다.

$$ \log(I + B) = B + O(\| B^{2} \|) $$

여기서 $O$는 빅오 표기법이다.

성질

(a) $(2)$와 같은 $\log$는 집합 $D = \left\{ A \in M_{n \times n}(\mathbb{C}) : \| A - I \| \lt 1 \right\}$ 위에서 정의되고, 연속인 함수이다.

(b) $A \in D$에 대해서, $$ e^{\log A} = A $$

 (b') $A$가 멱일원 이면, $e^{\log A} = A$이다.

(c) $\| X \| \lt \log 2$인 $X \in M_{n \times n}(\mathbb{C})$에 대해서, $$ \| e^{X} - I \| \lt 1 \text{ and } \log e^{X} = X $$

 (c') $X$가 멱영이면, $\log( e^{X} ) = X$이다.

(d) $\| B \| \lt 1/2$가 성립하는 모든 $B \in M_{n \times n}(\mathbb{C})$에 대해서, 다음을 만족하는 상수 $c$가 존재한다. $$ \| \log (I + B) - B \| \le c \| B \|^{2} $$

증명

(a)

행렬 수렴의 성질:

$$ \| A_{n} - A \| \to 0 \text{ as } n \to \infty \iff \lim\limits_{n \to \infty} A_{n} = A $$

급수를 합과 극한으로 풀어내면,

$$ \log A = \lim\limits_{M \to \infty} \sum_{m = 1}^{M} (-1)^{m+1} \dfrac{(A - I)^{m}}{m} $$

이때 행렬 놈의 성질에 의해 $\| (A - I)^{m} \| \le \| A - I \|^{m}$가 성립한다. 따라서 다음을 얻는다.

$$ \sum\limits_{m = 1}^{M} \left\| (-1)^{m+1} \dfrac{(A - I)^{m}}{m} \right\| \le \sum\limits_{m = 1}^{M} \dfrac{\| A - I \|^{m}}{m} $$

여기서 $\| A - I \| \lt 1$이면 비 판정법에 의해 급수가 절대수렴하고, 수렴한다.

또한, 위의 부등식과 바이어슈트라스-M 판정법에 의해 $\log A$는 연속이다.

(b)

경우1: $A$가 대각화가능

$A$가 대각화가능하다고 하자.

$$ A = C D C^{-1} $$

그러면 $(A - I)^{m}$은 다음과 같다.

$$ \begin{align*} (A - I)^{m} &= (CDC^{-1} - CIC^{-1})^{m} \\ &= \left[ C(D - I)C^{-1} \right]^{m} \\ &= C(D - I)^{m}C^{-1} \\ &= C\begin{bmatrix} (d_{1} - 1)^{m} & & 0 \\ & \ddots & \\ 0 & & (d_{n} - 1)^{m} \end{bmatrix}C^{-1} \end{align*} $$

$\| A - I \| \lt 1$이므로, 각각의 $i$에 대해 $|d_{i} - 1| \lt 1$이어야 한다. 따라서 다음을 얻는다.

$$ \begin{align*} \log A &= \sum\limits_{m=1}^{\infty} (-1)^{m+1} \dfrac{(A - I)^{m}}{m} \\ &= \sum\limits_{m=1}^{\infty} \left( C\begin{bmatrix} (-1)^{m+1} \dfrac{(d_{1} - 1)^{m}}{m} & & 0 \\ & \ddots & \\ 0 & & (-1)^{m+1} \dfrac{(d_{n} - 1)^{m}}{m} \end{bmatrix}C^{-1} \right) \\ &= C \left( \sum\limits_{m=1}^{\infty} \begin{bmatrix} (-1)^{m+1} \dfrac{(d_{1} - 1)^{m}}{m} & & 0 \\ & \ddots & \\ 0 & & (-1)^{m+1} \dfrac{(d_{n} - 1)^{m}}{m} \end{bmatrix} \right)C^{-1} \\ &= C \begin{bmatrix} \log d_{1} & & 0 \\ & \ddots & \\ 0 & & \log d_{n} \end{bmatrix}C^{-1} \end{align*} $$

행렬 지수의 성질:

$$ e^{CXC^{-1}} = Ce^{X}C^{-1} $$

대각행렬 $D = [d_{ii}]$에 대해서, $$ e^{D} = \begin{bmatrix} e^{d_{11}} & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & e^{d_{nn}} \end{bmatrix} $$

그러면 행렬지수의 성질에 의해 아래와 같다.

$$ \begin{align*} e^{\log A} &= C \begin{bmatrix} e^{\log d_{1}} & & 0 \\ & \ddots & \\ 0 & & e^{\log d_{n}} \end{bmatrix}C^{-1} \\ &= C \begin{bmatrix} d_{1} & & 0 \\ & \ddots & \\ 0 & & d_{n} \end{bmatrix}C^{-1} \\ &= CDC^{-1} = A \end{align*} $$

경우2: $A$가 대각화불가능

$A$가 대각화불가능이라 하자. $A$로 수렴하는 대각화가능한 행렬 $A_{n}$들의 수열이 존재한다.

$$ \lim\limits_{n \to \infty} A_{n} = A, \qquad A_{n} \text{ is diagonalizable} $$

행렬의 지수와 로그는 연속함수이므로 다음을 얻는다.

$$ e^{\log A} = e^{ \log (\lim\limits_{n \to \infty} A_{n})} = \lim\limits_{n \to \infty} e^{\log A_{n}} = \lim\limits_{n \to \infty} A_{n} = A $$

(b')

증명

(c)

$\| e^{X} - I \| \le e^{\| X \|} - 1$이므로,

$$ \| e^{X} - I \| \le e^{\| X \|} - 1 \le e^{\log 2} - 1 \le 1 $$

따라서 $\log e^{X}$가 수렴한다. $\log e^{X} = X$임을 보이는 것은 $e^{\log A} = A$를 보이는 것과 같은 방법으로 가능하다.

(c')

증명

(d)

$$ \begin{align*} \log (I + B) - B &= \sum\limits_{m=1}^{\infty} (-1)^{m+1} \dfrac{B^{m}}{m} - B \\ &= \sum\limits_{m=2}^{\infty} (-1)^{m+1} \dfrac{B^{m}}{m} \\ &= B^{2} \sum\limits_{m=2}^{\infty} (-1)^{m+1} \dfrac{B^{m-2}}{m} \end{align*} $$

$\| B \| \le 1/2$이므로,

$$ \| \log (I + B) - B \| \le \| B \|^{2} \sum\limits_{m=2}^{\infty} \dfrac{(1/2)^{m-2}}{m} $$


  1. Brian C. Hall. Lie Groups, Lie Algebras, and Representations (2nd), p36-39 ↩︎