직교행렬
정의
$A$를 정사각 실수 행렬이라고 하자. $A$가 아래의 식을 만족하면 직교행렬orthogonal matrix이라 한다.
$$ A^{-1} = A^{\mathsf{T}} $$
위 조건을 다르게 표현하면 다음과 같다.
$$ AA^{\mathsf{T}} = A^{\mathsf{T}}A =I $$
설명
정의를 말로 풀어서 쓰면, 직교행렬이란 각각의 행벡터 혹은 열벡터들이 서로 직교하는 단위 벡터인 행렬이다. 복소수 행렬으로 확장한 경우에는 유니터리 행렬이라 부른다.
아래에서 직교행렬일 동치 조건을 보면 직교행렬이란 각도와 길이는 보존하는 행렬이라는 것을 알 수 있다. 쉽게 2차원을 생각해보자. 2차원 평면 위의 벡터는 $x$축과 $y$축, 두 축으로 기술된다. 이 둘 사이의 각도와 각각의 길이가 보존되는 것으로는 회전과 반사가 있다. 즉 직교행렬이란 회전행렬과 반사행렬 모두를 포함하는 개념이다. 특히나 직교행렬의 행렬식은 $+1$이거나 $-1$인데, 이 중에서 행렬식이 $+1$인 경우 회전행렬로, $-1$인 경우 반사행렬로 구분할 수 있다. 벡터를 다른 벡터로 대응시키는 변환으로서의 행렬을 생각해보면, 그 행렬식의 부호는 축의 순서와 관련이 있다. 회전의 경우에는 두 축의 순서가 바뀌지 않으므로 행렬식이 $+1$, 반사의 경우에는 두 축의 순서가 바뀌므로 행렬식이 $-1$인 것이다.
회전
2차원 평면상의 벡터를 반시계 방향으로 $\theta$만큼 회전시키는 변환은 다음과 같다.
$$ A = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix} $$
아래의 식에 의해 회전 변환은 임의의 $\theta$에 대해서 직교행렬임을 알 수 있다.
$$ A^{\mathsf{T}} A = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix} \begin{bmatrix} \cos \theta & \sin \theta \\ -\sin \theta & \cos \theta \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} = I $$
또한 그 행렬식은 $+1$이다.
$$ \det(A) = \cos^{2}\theta - (-\sin^{2}\theta) = \cos^{2}\theta + \sin^{2}\theta = 1 $$
반사
2차원 평면상의 벡터를 $y$축을 기준으로 반사시키는 변환은 다음과 같다.
$$ A = \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} $$
$$ \begin{bmatrix} -x \\ y \end{bmatrix} = \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} $$
이는 아래에서 보이듯이 직교행렬이며 행렬식은 $-1$이다.
$$ A^{\mathsf{T}}A = \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} = I $$
$$ \det(A) = (-1) \cdot (1) - 0 \cdot 0 = -1 $$
성질
직교행렬은 다음의 성질을 갖는다.
직교행렬의 전치도 직교행렬이다.
직교행렬의 역행렬은 직교행렬이다.
두 직교행렬의 곱은 직교행렬이다.
직교행렬의 행렬식은 $1$이거나 $-1$이다.
$$ \det(A)=\pm 1 $$
직교행렬일 동치 조건
$n \times n$ 실수 행렬 $A$에 대해서 아래의 명제는 모두 동치이다.
$A$가 직교행렬이다.
$A$의 행 벡터들의 집합은 $\mathbb{R}^n$의 정규직교집합이다.
$A$의 열 벡터들의 집합은 $\mathbb{R}^n$의 정규직교집합이다.
$A$가 내적(각도)을 보존한다. 즉 모든 $\mathbf{x},\mathbf{y}\in \mathbb{R}^{n}$에 대해서 다음이 성립한다.
$$ (A \mathbf{x}) \cdot (A\mathbf{y}) = \mathbf{x} \cdot \mathbf{y} $$
- $A$가 놈(길이)을 보존한다. 즉 모든 $\mathbf{x}\in \mathbb{R}^{n}$에 대해서 다음이 성립한다.
$$ \left\| A \mathbf{x} \right\| = \left\| \mathbf{x} \right\| $$