logo

행렬의 내적 (프로베니우스 내적) 📂행렬대수

행렬의 내적 (프로베니우스 내적)

정의

두 $m \times n$ 행렬 $X = [x_{ij}]$, $Y=[Y]_{ij}$의 내적inner product 혹은 점곱dot product 다음과 같이 정의한다.

$$ X \cdot Y = \braket{X, Y} = \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} $$

성분이 복소수복소행렬인 경우에는 다음과 같다.

$$ X \cdot Y = \braket{X, Y} = \sum_{i=1}^{m}\sum\limits_{j=1}^{n} \overline{x}_{ij}y_{ij} $$

$\overline{x}$는 켤레 복소수이다.

설명

벡터의 내적(점곱)이 "두 벡터의 각 성분을 서로 곱하고, 모두 더하는 것"이므로, 행렬의 내적을 위와 같이 정의하면 벡터의 내적에 대한 자연스러운 일반화가 된다. 이를 아래와 같이 표기하여 프로베니우스 내적Frobenius inner product이라고도 하는데, 별 다른 뜻이 있는 건 아니고 그냥 사람 이름이다.

$$ \braket{X, Y}_{F} $$

엄청 메이저하게 쓰이는 것까지는 아니고, 그냥 표기법의 취향차이다. $X$, $Y$가 행렬이라는 것을 강조하고 싶을 때 쓰인다고 보면 된다.

내적이 있으면 놈을 자연스럽게 정의할 수 있으므로, 행렬의 (프로베니우스) 놈을 다음과 같이 정의한다.

$$ \| X \|_{F} := \sqrt{\braket{X, X}_{F}} = \sqrt{\sum\limits_{i,j} (x_{ij})^{2}} = \sqrt{\Tr (X^{\mathsf{T}}X)} $$

위에서 설명했듯 아랫첨자 $_{F}$를 표기하지 않는 경우도 많다. 마지막 등식은 아래의 공식에 의해 성립한다.

기초성질

복소행렬 $X$, $Y$, $Z$와 복소수 $\alpha, \beta$에 대해서,

  • 선형성:
    • $\braket{\alpha X, \beta Y} = \overline{\alpha}\beta \braket{X, Y}$
    • $\braket{X + Y, Z} = \braket{X, Z} + \braket{Y, Z}$
    • $\braket{X, Y + Z} = \braket{X, Y} + \braket{X, Z}$
  • 켤레대칭성: $\braket{X, Y} = \overline{\braket{Y, X}}$

공식

$(1)$ 다음이 성립한다. $$ X \cdot Y = \sum_{i, j} x_{ij}y_{ij} = \Tr (X Y^{\mathsf{T}}) = \Tr (X^{\mathsf{T}}Y) $$ 복소행렬인 경우에는 $$ X \cdot Y = \sum_{i, j} \overline{x}_{ij}y_{ij} = \Tr (X Y^{\ast}) = \Tr (X^{\ast}Y) $$ $^{\ast}$는 켤레전치이다.

증명

$(1)$

인덱스 $i$에 대해서 풀어써보면,

$$ \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} = \sum\limits_{j=1}^{n} x_{1j}y_{1j} + \sum\limits_{j=1}^{n} x_{2j}y_{2j} + \cdots + \sum\limits_{j=1}^{n} x_{nj}y_{nj} $$

첫번째항은 $XY^{\mathsf{T}}$의 $1$행, $1$열 성분이다.

행렬의 거듭제곱꼴

$$ [AB^{\mathsf{T}}]_{ij} = \left[ \sum_{k} a_{ik}b_{jk}\right] $$

두번째항은 $[XY^{\mathsf{T}}]_{22}$, $i$번째 항은 $[XY^{\mathsf{T}}]_{ii}$이다. 따라서 정리하면,

$$ \sum_{i=1}^{m}\sum\limits_{j=1}^{n} x_{ij}y_{ij} = \sum\limits_{i} [XY^{\mathsf{T}}]_{ii} $$

이는 트레이스의 정의와 같다. $\Tr(A) = \Tr(A^{\mathsf{T}})$이므로, 최종적으로 다음을 얻는다.

$$ X \cdot Y = \braket{X, Y} = \sum_{i, j} x_{ij}y_{ij} = \Tr (X Y^{\mathsf{T}}) = \Tr (X^{\mathsf{T}}Y) $$