행렬 지수의 성질
정의1
행렬의 지수함수 $\exp : M_{n \times n}(\mathbb{C}) \to M_{n \times n}(\mathbb{C})$를 다음과 같이 정의하고, 이를 행렬 지수(함수)matrix exponential라 한다.
$$ \exp (X) = e^{X} := \sum\limits_{m=0}^{\infty} \dfrac{X^{m}}{m!} \tag{1} $$
이때 위의 극한은 행렬의 극한을 의미한다.
설명
행렬 지수는 지수함수를 행렬에 대해 일반화한 것으로 실수 위에서 정의되는 지수함수의 성질을 그대로 따른다. $X^{0}$은 단위행렬 $I$로 정의한다. $e^{X}$ 그 자체도 $n \times n$ 행렬임에 유의하자.
성질
$X, Y \in M_{n \times n}(\mathbb{C})$, $\alpha, \beta \in \mathbb{C}$라고 하자. 그러면 다음의 행렬 지수 함수는 다음의 성질을 갖는다.
(a) 모든 $X \in M_{n \times n}(\mathbb{C})$에 대해서, 급수 $(1)$은 수렴하고 $e^{X}$는 연속함수이다.
(b) $e^{O} = I$ ($O$는 영행렬)
(c) $(e^{X})^{\ast} = e^{X^{\ast}}$
(d) $e^{X}$는 가역행렬이고 $(e^{X})^{-1} = e^{-X}$이다.
(e) $e^{(\alpha + \beta) X} = e^{\alpha X} e^{\beta X}$
(f) 만약 $XY = YX$이면, $e^{X+Y} = e^{X} e^{Y} = e^{Y} e^{X}$이다.
(g) 만약 $C \in \operatorname{GL}(n, \mathbb{C})$이면, $e^{C X C^{-1}} = C e^{X} C^{-1}$이다. 이때 $\operatorname{GL}(n, \mathbb{C})$은 일반선형군이다.
(h) 대각행렬 $D = [d_{ii}]$에 대해서, $e^{D} = \begin{bmatrix} e^{d_{11}} & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & e^{d_{nn}} \end{bmatrix}$이다. $$ e^{\diag (d_{11}, \dots, d_{nn})} = \diag (e^{d_{11}}, \dots, e^{d_{nn}}) $$
(h') 블럭대각행렬의 지수는, 지수의 블럭대각행렬과 같다. $$ e^{\diag(X_{1}, \dots, X_{r})} = \diag(e^{X_{1}}, \dots, e^{X_{r}}) $$
(g)+(h) $X$가 대각화가능하면, $e^{X}$도 대각화가능하다.
(i) $\| e^{X} \| \le e^{\| X \|}$이고 $\| e^{X} - I \| \le e^{\| X \|} - 1$이다.
(j) 리 곱 공식: $$ e^{X + Y} = \lim\limits_{m \to \infty} \left( e^{\frac{X}{m}} e^{\frac{Y}{m}} \right)^{m} $$
(k) $\det (e^{X}) = e^{\trace(X)}$
증명
(a)
행렬 놈의 성질 $\| AB \| \le \| A \| \| B \|$과 삼각 부등식 $\| A + B \| \le \| A \| + \| B \|$에 의해 다음을 얻는다.
$$ \| X^{m} \| \le \| X \|^{m} $$
$$ \implies \left\| \sum\limits_{m=0}^{\infty} \dfrac{X^{m}}{m!} \right\| \le \sum\limits_{m=0}^{\infty} \left\| \dfrac{X^{m}}{m!} \right\| \le \sum\limits_{m=0}^{\infty} \dfrac{\| X \|^{m}}{m!} \lt \infty $$
$\| X \|$는 스칼라이므로, 우변의 값은 실수 위에서 정의된 지수함수의 함숫값 $e^{\| X \|}$와 같고, 유계이다. 따라서 $e^{X}$가 절대수렴하므로, 수렴한다.
또한, 위의 부등식과 바이어슈트라스-M 판정법에 의해 $e^{X}$는 균등수렴하고 연속이다.
■
(b)
■
(c)
행렬 지수의 정의와 행렬 극한의 성질에 의해 다음이 성립한다.
$$ (e^{X})^{\ast} = \left( \lim\limits_{M \to \infty} \sum_{m = 0}^{M} \dfrac{X^{m}}{m!}\right)^{\ast} = \lim\limits_{M \to \infty} \left( \sum_{m = 0}^{M} \dfrac{X^{m}}{m!}\right)^{\ast} = \lim\limits_{M \to \infty} \sum_{m = 0}^{M} \dfrac{(X^{\ast})^{m}}{m!} = e^{X^{\ast}} $$
■
(d)
방법1
수렴하는 두 급수의 곱은 아래와 같이 표현된다.
$$ \begin{align*} e^{X} e^{-X} &= \left( \sum\limits_{m = 0}^{\infty} \dfrac{X^{m}}{m!} \right) \left( \sum\limits_{m = 0}^{\infty} \dfrac{(-1)^{m}X^{m}}{m!} \right) \\ &= \sum_{m = 0}^{\infty} \sum_{k = 0}^{m} \dfrac{X^{k}}{k!} \dfrac{(-1)^{m-k}X^{m-k}}{(m-k)!} \\ &= \sum_{m = 0}^{\infty} \dfrac{1}{m!} \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} (-1)^{m-k}X^{m} \\ &= \sum_{m = 0}^{\infty} \dfrac{X^{m}}{m!} \left( \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} (-1)^{m-k} \right) \end{align*} $$
이때 괄호 안의 값은 이항정리로 나타난다.
$$ \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} (-1)^{m-k} = \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} 1^{k}(-1)^{m-k} = (1 + (-1))^{m} $$
이 값은 $m=0$일 때만 $1$이고, 나머지 경우에는 $0$이므로 다음의 결론을 얻는다.
$$ e^{X}e^{-X} = \dfrac{X^{0}}{0!} = I $$
■
방법2
(f) 에서 $Y = -X$를 대입하면 성립한다.
■
(e)
(f) 의 따름정리로서 성립한다.
■
(f)
증명 (d) 방법1과 같은 방식으로 증명한다. $e^{X}e^{Y}$는 다음과 같다.
$$ e^{X}e^{Y} = \sum_{m = 0}^{\infty} \dfrac{1}{m!} \left( \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} X^{m}Y^{m-k} \right) $$
$X$와 $Y$가 교환가능하다고 가정했으므로, 이항정리에 의해 다음을 얻는다.
$$ (X + Y)^{m} = \sum_{k = 0}^{m} \dfrac{m!}{k!(m-k)!} X^{m}Y^{m-k} $$
$$ \implies e^{X}e^{Y} = \sum\limits_{m = 0}^{\infty}\dfrac{(X + Y)^{m}}{m!} = e^{X+Y} = e^{Y}e^{X} $$
■
(g)
$e^{X}$의 정의와 행렬 극한의 성질에 의해 다음이 성립한다.
$$ \begin{align*} e^{CXC^{-1}} &= \sum\limits_{m = 0}^{\infty} \dfrac{(C X C^{-1})^{m}}{m!} \\ &= \sum\limits_{m = 0}^{\infty} \dfrac{C X^{m} C^{-1}}{m!} \\ &= \lim\limits_{M \to \infty}\sum\limits_{m = 0}^{M} \dfrac{C X^{m} C^{-1}}{m!} \\ &= \lim\limits_{M \to \infty} C \left( \sum\limits_{m = 0}^{M} \dfrac{X^{m}}{m!} \right) C^{-1} \\ &= C \left( \lim\limits_{M \to \infty} \sum\limits_{m = 0}^{M} \dfrac{X^{m}}{m!} \right) C^{-1} \\ &= C e^{X} C^{-1} \end{align*} $$
■
(h')
우선 블럭대각행렬의 거듭제곱은, 거듭제곱행렬의 블럭대각행렬과 같다.
$$ \left( \diag(X_{1}, \dots, X_{r}) \right)^{k} = \diag((X_{1})^{k}, \dots, (X_{r})^{k}) $$
따라서 행렬지수의 정의에 따라 다음을 얻는다.
$$ e^{\diag(X_{1}, \dots, X_{r})} = \sum\limits_{m=0}^{\infty} \dfrac{\left( \diag(X_{1}, \dots, X_{r}) \right)^{m}}{m!} = \sum\limits_{m=0}^{\infty} \dfrac{\diag(X_{1}^{m}, \dots, X_{r}^{m})}{m!} $$
그런데 합도 블럭별로 계산하면 되므로, 다음이 성립한다.
$$ \sum\limits_{m=0}^{\infty} \dfrac{\diag(X_{1}^{m}, \dots, X_{r}^{m})}{m!} = \diag\left( \sum\limits_{m=0}^{\infty} \dfrac{X_{1}^{m}}{m!}, \dots, \sum\limits_{m=0}^{\infty} \dfrac{X_{r}^{m}}{m!} \right) = \diag(e^{X_{1}}, \dots, e^{X_{r}}) $$
■
(i)
행렬 놈의 성질 $\| A B \| \le \| A \| \| B \|$에 의해 다음이 성립한다.
$$ \| e^{X} \| = \left\| \sum\limits_{m = 0}^{\infty} \dfrac{X^{m}}{m!} \right\| \le \sum\limits_{m = 0}^{\infty} \left\| \dfrac{X^{m}}{m!} \right\| \le \sum\limits_{m = 0}^{\infty} \| X \|^{m}/m! = e^{\| X \|} $$
■
(j)
■
(k)
경우1: $X$가 대각화가능
$X \in M_{n \times n}(\mathbb{C})$가 대각화가능하다고 하자. 그러면 (g) 와 (h) 에 의해 $e^{X}$도 대각화가능하다. $X$의 고유값을 $\lambda_{1}, \dots, \lambda_{n}$라 하면, $e^{X}$의 고유값은 $e^{\lambda_{1}}, \dots, e^{\lambda_{n}}$이다. 따라서 다음을 얻는다. $X$의 대각화를 $X = C^{-1} D C$라 하면,
$$ \begin{align*} \det (e^{X}) &= \det( C e^{D} C^{-1}) = \det (C) \det (e^{D}) \det (C^{-1}) \\ &= \det (e^{D}) \\ &= e^{\lambda_{1}} \cdots e^{\lambda_{n}} \\ &= e^{\lambda_{1} + \cdots + \lambda_{n}} \\ &= e^{\trace(X)} \end{align*} $$
■
경우2: $X$가 대각화불가능
$X$가 대각화불가능이라 하자. 하지만 $X$로 수렴하는 대각화가능한 행렬 $X_{n}$들의 수열이 존재한다.
$$ \lim\limits_{n \to \infty} X_{n} = X, \qquad X_{n} \text{ is diagonalizable} $$
행렬 지수와 행렬식, 대각합은 모두 연속이므로 다음이 성립한다.
$$ \det (e^{X}) = \det (e^{\lim\limits_{n \to \infty} X_{n}}) = \lim\limits_{n \to \infty} \det (e^{X_{n}}) = \lim\limits_{n \to \infty} e^{\trace(X_{n})} = e^{\trace(X)} $$
■
Brian C. Hall. Lie Groups, Lie Algebras, and Representations (2nd), p31-34 ↩︎

저희들의 저서 「줄리아 프로그래밍」이 2024 세종도서 학술부문에 선정되었습니다!

