logo

일반직교군 📂표현론

일반직교군

도입

직교군이란, 직교행렬들의 집합으로 행렬곱에 대하여 이 된다. 직교행렬은 내적을 보존하는 행렬이므로, 직교군을 내적을 보존하는 행렬들의 군으로도 볼 수 있다.

$$ \begin{align*} \operatorname{O}(n) &= \left\{ Q \in M_{n \times n}(\mathbb{R}) : Q^{\mathsf{T}}Q = I \right\} \\ &= \left\{ Q \in M_{n \times n}(\mathbb{R}) : \braket{Q\mathbf{x}, Q\mathbf{y}} = \braket{\mathbf{x}, \mathbf{y}} \quad \forall \mathbf{x}, \mathbf{y} \in \mathbb{R}^{n} \right\} \end{align*} $$

$n$차원 벡터공간에서의 표준 내적은 아래와 같이 주어진다.

$$ \braket{\mathbf{x}, \mathbf{y}} = \mathbf{x}^{\mathsf{T}} \mathbf{y} = x_{1} y_{1} + \cdots + x_{n} y_{n} $$

이는 대칭 쌍선형 형식의 일종으로, 벡터공간 $\mathbb{R}^{n+k}$ 위에서 정의된 아래와 같은 연산 $[\cdot, \cdot]$도 대칭 쌍선형 형식이 된다.

$$ [\mathbf{x}, \mathbf{y}]_{n,k} = x_{1}y_{1} + \cdots + x_{n}y_{n} - x_{n+1}y_{n+1} - \cdots - x_{n+k}y_{n+k} $$

그러면 직교군의 일반화로, $[\cdot, \cdot]_{n,k}$이 보존되는 어떤 행렬들의 집합을 생각할 수 있고, 이것이 일반직교군이다.

정의1

위의 표기법을 그대로 따라서, 일반직교군generalized orthogonal group $\operatorname{O}(n, k)$를 아래와 같이 정의한다.

$$ \operatorname{O}(n, k) = \left\{ Q \in M_{(n+k) \times (n+k)}(\mathbb{R}) : [Q \mathbf{x}, Q \mathbf{y}]_{n,k} = [\mathbf{x}, \mathbf{y}]_{n,k} \quad \forall \mathbf{x}, \mathbf{y} \in \mathbb{R}^{n+k} \right\} $$

설명

물리학을 공부했다면 위의 $[\cdot, \cdot]$이 익숙하게 느껴질 것이다. 물리학에서 특히 관심있게 다루는 것은 $\operatorname{O}(1, 3)$이며 이를 로런츠 군Lorentz group이라 한다. 로런츠 군에 대해서 두 가지 정의가 쓰이는데, 최근 들어서 $\operatorname{O}(1, 3)$를 선호하는 경향이 강해지고 있는 듯 하다. 다만 $\operatorname{O}(3; 1)$도 여전히 많이 쓰이고 있으며, 특히 이전의 문헌들에서는 $\operatorname{O}(3, 1)$라고 표기된 경우가 많다고 한다. 물론 본질적으로는 둘 다 같으므로 어느 정의를 쓰든 취향차이라 할 수 있다.

행렬 $\Lambda$를 $n$번째 성분까지는 $+1$, $n+1$번째 성분부터 $n+k$번째 성분까지는 $-1$인 대각행렬이라고 하자.

$$ \Lambda = \begin{bmatrix} I_{n\times n} & O \\ O & -I_{k\times k} \end{bmatrix} \tag{1} $$

그러면 다음이 성립한다.

$$ [\mathbf{x}, \mathbf{y}]_{n,k} = \mathbf{x}^{\mathsf{T}} \Lambda \mathbf{y} = \braket{\mathbf{x}, \Lambda \mathbf{y}} \tag{2} $$

또한 아래의 정리로부터, 위의 정의가 다음과 동치라는 것을 알 수 있다.

$$ \operatorname{O}(n, k) = \left\{ Q \in M_{(n+k) \times (n+k)}(\mathbb{R}) : Q^{\mathsf{T}} \Lambda Q = \Lambda \right\} $$

부분군

일반직교군은 일반선형군 $\operatorname{GL}(n+k, \mathbb{R})$의 부분군이다. 부분군 판정법에 의해 $A, B \in \operatorname{O}(n, k) \implies AB^{-1} \in \operatorname{O}(n, k)$임을 보이면 된다. $A$가 $[\cdot, \cdot]_{n,k}$를 보존하므로,

$$ [AB^{-1}\mathbf{x}, AB^{-1}\mathbf{y}]_{n,k} = [A(B^{-1}\mathbf{x}), A(B^{-1}\mathbf{y})]_{n,k} = [B^{-1}\mathbf{x}, B^{-1}\mathbf{y}]_{n,k} $$

$B$가 $[\cdot, \cdot]_{n,k}$를 보존하므로,

$$ [B^{-1}\mathbf{x}, B^{-1}\mathbf{y}]_{n,k} = [B(B^{-1}\mathbf{x}), B(B^{-1}\mathbf{y})]_{n,k} = [\mathbf{x}, \mathbf{y}]_{n,k} $$

따라서 $AB^{-1} \in \operatorname{O}(n, k)$이므로 $\operatorname{GL}(n+k, \mathbb{R})$의 부분군이다.

$$ \operatorname{O}(n, k) \le \operatorname{GL}(n+k, \mathbb{R}) $$

행렬 리 군

$\operatorname{O}(n, k)$는 $\operatorname{GL}(n+k, \mathbb{R})$의 닫힌부분군이므로 행렬 리 군이 된다. 함수 $f : \operatorname{GL}(n+k, \mathbb{R}) \to M_{(n+k)\times(n+k)}(\mathbb{R})$을 다음과 같이 정의하자.

$$ f(Q) = Q^{\mathsf{T}} \Lambda Q $$

그러면 $f$는 연속함수이다. 연속함수의 닫힌 집합에 대한 프리이미지는 닫힌 집합임을 기억하자. $Q \in \operatorname{O}(n, k)$일 필요충분조건이 $Q^{\mathsf{T}} \Lambda Q = \Lambda$이고, 닫힌집합 $\left\{ \Lambda \right\}$의 프리이미지가 $f^{-1}(\left\{ \Lambda \right\}) = \operatorname{O}(n, k)$이므로, $\operatorname{O}(n, k)$는 $\operatorname{GL}(n+k, \mathbb{R})$의 닫힌부분군이 되어 행렬 리 군이다.

성질

$Q = \begin{bmatrix} q_{1} & \cdots & q_{n+k} \end{bmatrix}$라 하자. $e_{i}$를 표준기저벡터라 하자.

(a) $Q \in \operatorname{O}(n, k)$이면, $[q_{i}, q_{j}]_{n,k} = [e_{i}, e_{j}]_{n,k}$이고 값은 다음과 같다.

$$ \begin{align*} [q_{i}, q_{j}]_{n,k} &= 0 && i \ne j \\ [q_{i}, q_{i}]_{n,k} &= 1 && 1 \le i \le n \\ [q_{i}, q_{i}]_{n,k} &=-1 && n+1 \le i \le n+k \\ \end{align*} $$

역도 성립한다.

(b) $Q \in \operatorname{O}(n, k)$에 대해서, $\det (Q) = \pm 1$이다.

증명

(a)

아래 정리 증명에서 유도된다.

(b)

아래의 정리 결과로부터, $$ \det (Q^{\mathsf{T}} \Lambda Q) = \det (\Lambda) \implies (\det(Q))^{2} \det(\Lambda) = \det(\Lambda) \implies \det(Q) = \pm 1 $$

정리

$\Lambda$를 $(1)$과 같다고 하자. $Q \in \operatorname{O}(n, k)$일 필요충분조건은 $Q^{\mathsf{T}}\Lambda Q = \Lambda$가 성립하는 것이다.

$$ [Q \mathbf{x}, Q \mathbf{y}]_{n,k} = [\mathbf{x}, \mathbf{y}]_{n,k} \iff Q^{\mathsf{T}}\Lambda Q = \Lambda $$

증명

$(\implies)$

$Q = \begin{bmatrix} q_{1} & \cdots & q_{n+k} \end{bmatrix} \in \operatorname{O}(n, k)$라고 하자. 그러면 $(2)$에 의해 다음이 성립한다.

$$ \begin{align*} Q^{\mathsf{T}} q Q &= \begin{bmatrix} –q_{1}^{\mathsf{T}}– \\ \vdots \\ –q_{n+k}^{\mathsf{T}}– \end{bmatrix} \Lambda \begin{bmatrix} \underset{\vert}{\overset{\vert}{q_{1}}} & \cdots & \underset{\vert}{\overset{\vert}{q_{n+k}}} \end{bmatrix} \\ &= \begin{bmatrix} \braket{q_{1}, \Lambda q_{1}} & \braket{q_{1}, \Lambda q_{2}} & \cdots & \braket{q_{1}, \Lambda q_{n+k}} \\ \braket{q_{2}, \Lambda q_{1}} & \braket{q_{2}, \Lambda q_{2}} & \cdots & \braket{q_{2}, \Lambda q_{n+k}} \\ \vdots & \vdots & \ddots & \vdots \\ \braket{q_{n+k}, \Lambda q_{1}} & \braket{q_{n+k}, \Lambda q_{2}} & \cdots & \braket{q_{n+k}, \Lambda q_{n+k}} \end{bmatrix} \\ &= \begin{bmatrix} [q_{1}, q_{1}]_{{n,k}} & [q_{1}, q_{2}]_{{n,k}} & \cdots & [q_{1}, q_{n+k}]_{{n,k}} \\ [q_{2}, q_{1}]_{{n,k}} & [q_{2}, q_{2}]_{{n,k}} & \cdots & [q_{2}, q_{n+k}]_{{n,k}} \\ \vdots & \vdots & \ddots & \vdots \\ [q_{n+k}, q_{1}]_{{n,k}} & [q_{n+k}, q_{2}]_{{n,k}} & \cdots & [q_{n+k}, q_{n+k}]_{{n,k}} \end{bmatrix} \\ &= \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & & \cdots & -1 \end{bmatrix} \\ &= \Lambda \end{align*} $$

$(\impliedby)$

$[\cdot, \cdot]$이 쌍선형이므로, 표준기저벡터 $e_{i}$에 대해서 $[Qe_{i}, Qe_{j}] = [e_{i}, e_{j}]$가 성립하는 것을 보이는 걸로 충분하다. $Q^{\mathsf{T}} g Q = g$라고 하자. 위에서 계산한 바에 따르면 이는 다음과 같다.

$$ \begin{bmatrix} [q_{1}, q_{1}]_{{n,k}} & [q_{1}, q_{2}]_{{n,k}} & \cdots & [q_{1}, q_{n+k}]_{{n,k}} \\ [q_{2}, q_{1}]_{{n,k}} & [q_{2}, q_{2}]_{{n,k}} & \cdots & [q_{2}, q_{n+k}]_{{n,k}} \\ \vdots & \vdots & \ddots & \vdots \\ [q_{n+k}, q_{1}]_{{n,k}} & [q_{n+k}, q_{2}]_{{n,k}} & \cdots & [q_{n+k}, q_{n+k}]_{{n,k}} \end{bmatrix} = g = \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & & \cdots & -1 \end{bmatrix} $$

즉 다음이 성립한다.

$$ \begin{align*} [q_{i}, q_{j}]_{n,k} &= 0 && i \ne j \\ [q_{i}, q_{i}]_{n,k} &= 1 && 1 \le i \le n \\ [q_{i}, q_{i}]_{n,k} &=-1 && n+1 \le i \le n+k \\ \end{align*} $$

이는 $[e_{i}, e_{j}]_{n,k}$의 값과 같다.

$$ \begin{align*} [q_{i}, q_{j}]_{n,k} &= 0 = [e_{i}, e_{j}]_{n,k} && i \ne j \\ [q_{i}, q_{i}]_{n,k} &= 1 = [e_{i}, e_{i}]_{n,k} && 1 \le i \le n \\ [q_{i}, q_{i}]_{n,k} &=-1 = [e_{i}, e_{i}]_{n,k} && n+1 \le i \le n+k \\ \end{align*} $$

그리고 $Qe_{i} = q_{i}$가 성립하므로 다음을 얻는다.

$$ [Qe_{i}, Qe_{j}]_{n,k} = [q_{i}, q_{j}]_{n,k} = [e_{i}, e_{j}]_{n,k} $$

그러므로 $Q \in \operatorname{O}(n, k)$이다.


  1. Brian C. Hall. Lie Groups, Lie Algebras, and Representations (2nd), p8-9 ↩︎