행렬의 내적 (프로베니우스 내적)
정의
두 $m \times n$ 행렬 $X = [x_{ij}]$, $Y=[Y]_{ij}$의 내적inner product 혹은 점곱dot product 다음과 같이 정의한다.
$$ X \cdot Y = \braket{X, Y} = \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} $$
$$ X \cdot Y = \braket{X, Y} = \sum_{i=1}^{m}\sum\limits_{j=1}^{n} \overline{x}_{ij}y_{ij} $$
$\overline{x}$는 켤레 복소수이다.
설명
벡터의 내적(점곱)이 "두 벡터의 각 성분을 서로 곱하고, 모두 더하는 것"이므로, 행렬의 내적을 위와 같이 정의하면 벡터의 내적에 대한 자연스러운 일반화가 된다. 이를 아래와 같이 표기하여 프로베니우스 내적Frobenius inner product이라고도 하는데, 별 다른 뜻이 있는 건 아니고 그냥 사람 이름이다.
$$ \braket{X, Y}_{F} $$
엄청 메이저하게 쓰이는 것까지는 아니고, 그냥 표기법의 취향차이다. $X$, $Y$가 행렬이라는 것을 강조하고 싶을 때 쓰인다고 보면 된다.
놈
내적이 있으면 놈을 자연스럽게 정의할 수 있으므로, 행렬의 (프로베니우스) 놈을 다음과 같이 정의한다.
$$ \| X \|_{F} := \sqrt{\braket{X, X}_{F}} = \sqrt{\sum\limits_{i,j} (x_{ij})^{2}} = \sqrt{\Tr (X^{\mathsf{T}}X)} $$
위에서 설명했듯 아랫첨자 $_{F}$를 표기하지 않는 경우도 많다. 마지막 등식은 아래의 공식에 의해 성립한다.
기초성질
복소행렬 $X$, $Y$, $Z$와 복소수 $\alpha, \beta$에 대해서,
- 선형성:
- $\braket{\alpha X, \beta Y} = \overline{\alpha}\beta \braket{X, Y}$
- $\braket{X + Y, Z} = \braket{X, Z} + \braket{Y, Z}$
- $\braket{X, Y + Z} = \braket{X, Y} + \braket{X, Z}$
- 켤레대칭성: $\braket{X, Y} = \overline{\braket{Y, X}}$
공식
$(1)$ 다음이 성립한다. $$ X \cdot Y = \sum_{i, j} x_{ij}y_{ij} = \Tr (X Y^{\mathsf{T}}) = \Tr (X^{\mathsf{T}}Y) $$ 복소행렬인 경우에는 $$ X \cdot Y = \sum_{i, j} \overline{x}_{ij}y_{ij} = \Tr (X Y^{\ast}) = \Tr (X^{\ast}Y) $$ $^{\ast}$는 켤레전치이다.
증명
$(1)$
인덱스 $i$에 대해서 풀어써보면,
$$ \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} = \sum\limits_{j=1}^{n} x_{1j}y_{1j} + \sum\limits_{j=1}^{n} x_{2j}y_{2j} + \cdots + \sum\limits_{j=1}^{n} x_{nj}y_{nj} $$
첫번째항은 $XY^{\mathsf{T}}$의 $1$행, $1$열 성분이다.
$$ [AB^{\mathsf{T}}]_{ij} = \left[ \sum_{k} a_{ik}b_{jk}\right] $$
두번째항은 $[XY^{\mathsf{T}}]_{22}$, $i$번째 항은 $[XY^{\mathsf{T}}]_{ii}$이다. 따라서 정리하면,
$$ \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} = \sum\limits_{i} [XY^{\mathsf{T}}]_{ii} $$
이는 트레이스의 정의와 같다. $\Tr(A) = \Tr(A^{\mathsf{T}})$이므로, 최종적으로 다음을 얻는다.
$$ X \cdot Y = \braket{X, Y} = \sum_{i, j} x_{ij}y_{ij} = \Tr (X Y^{\mathsf{T}}) = \Tr (X^{\mathsf{T}}Y) $$
■