logo

프로베니우스 놈 📂행렬대수

프로베니우스 놈

정의 1

행렬 $A = \left( a_{ij} \right) \in \mathbb{C}^{m \times n}$ 에 대해 행렬의 놈 $\left\| \cdot \right\|_{F}$ 을 다음과 같이 정의하고 프로베니우스 놈Frobenius norm이라 부른다. $$ \left\| A \right\|_{F} = \sqrt{ \sum_{ij} \left| a_{ij} \right|^{2} } = \sqrt{ \text{Tr} \left( A^{\ast} A \right) } $$

설명

프로베니우스 놈은 힐베르트-슈미트 놈이라 불리기도 한다. $n = 1$, 즉 $m$차원 벡터들의 공간에선 유클리드 놈이 되므로 유클리드 놈의 자연스러운 일반화로 볼 수 있다.

프로베니우스라는 이름이 거창하게 있어보여서 그렇지 정의 자체는 전혀 어렵지 않으니 쉽게 생각하면 된다. 단순히 "놈"이라 쓰고 $\| \cdot \|$이라 표기하는 경우도 많으며, 프로베니우스$(\| \cdot \|_{F})$라는 표현은 대상이 행렬임을 강조할 때 쓴다고 받아들여도 된다.

이와 비슷하게 행렬의 내적프로베니우스 내적이라 부르기도 한다.

$$ \braket{A, B}_{F} := \sum\limits_{i = 1}^{m} \sum\limits_{j = 1}^{n} \overline{a_{ij}}b_{ij}, \qquad A, B \in M_{n \times n}(\mathbb{C}) $$

$$ \| A \|_{F} = \sqrt{\braket{A, A}_{F}} = \sqrt{\sum_{i,j} |a_{ij}|^{2}} = \sqrt{\Tr(A^{\ast}A)} $$

성질

$A \in M_{n \times n}(\mathbb{C})$, $\mathbf{x} \in \mathbb{C}^{n}$이라 하자. 다음이 성립한다. (벡터와 행렬에 대한 놈과 내적을 아랫첨자 $_{F}$로 구분한다.)

(a) $A$의 고유값 $\lambda_{i}$에 대해서, $\| A \|_{F} = \sqrt{\sum_{i} |\lambda_{i}|^{2}}$

(b) $\| A \mathbf{x} \| \le \| A \|_{F} \| \mathbf{x} \|$

(c) $\| A B \|_{F} \le \| A \|_{F} \| B \|_{F}$

증명

(a)

$A^{\ast}A$는 에르미트 행렬이므로, 유니터리 대각화 $A^{\ast}A = Q^{\ast} \Lambda Q$가 가능하다. $\lambda_{i}$를 $A$의 고유값이라하면, $A^{\ast}A$의 고유값은 $| \lambda_{i} |^{2}$이므로 다음을 얻는다. 트레이스의 순환성질에 의해,

$$ \begin{align*} \| A \|_{F} &= \sqrt{\Tr(A^{\ast}A)} = \sqrt{\Tr(Q^{\ast} \Lambda Q)} \\ &= \sqrt{\Tr(\Lambda Q Q^{\ast})} = \sqrt{\Tr(\Lambda)} \\ &= \sqrt{\sum_{i} |\lambda_{i}|^{2}} \end{align*} $$

(b)

내적과 놈의 성질트레이스의 순환성질, 코시-슈바르츠 부등식에 의해 다음이 성립한다.

$$ \begin{align*} \| A \mathbf{x} \| &= \sup\limits_{\| \mathbf{y} \| = 1} | \braket{\mathbf{y}, A \mathbf{x}} | \\ &= \sup\limits_{\| \mathbf{y} \| = 1} | \mathbf{y}^{\ast} A \mathbf{x} | \\ &= \sup\limits_{\| \mathbf{y} \| = 1} \Tr( | \mathbf{y}^{\ast} A \mathbf{x} | ) \\ &= \sup\limits_{\| \mathbf{y} \| = 1} \Tr( | \mathbf{x} \mathbf{y}^{\ast} A | ) \\ &= \sup\limits_{\| \mathbf{y} \| = 1} \Tr( | \braket{\mathbf{y} \mathbf{x}^{\ast}, A}_{F} | ) \\ &= \sup\limits_{\| \mathbf{y} \| = 1} | \braket{\mathbf{y} \mathbf{x}^{\ast}, A}_{F} | \\ &\le \sup\limits_{\| \mathbf{y} \| = 1} \| \mathbf{y} \mathbf{x}^{\ast} \|_{F} \| A \|_{F} \\ \end{align*} $$

여기서 행렬 놈의 성질에 의해 다음이 성립한다.

$$ \begin{align*} \| \mathbf{y} \mathbf{x}^{\ast} \|_{F} &= \sqrt{\Tr \left( (\mathbf{y} \mathbf{x}^{\ast})^{\ast} \mathbf{y} \mathbf{x}^{\ast} \right)} \\ &= \sqrt{\Tr \left( \mathbf{x} \mathbf{y}^{\ast} \mathbf{y} \mathbf{x}^{\ast} \right)} \\ &= \sqrt{\Tr \left( \mathbf{x} \| \mathbf{y} \|^{2} \mathbf{x}^{\ast} \right)} \\ &= \sqrt{\| \mathbf{y} \|^{2} \Tr \left( \mathbf{x} \mathbf{x}^{\ast} \right)} \\ &= \sqrt{\| \mathbf{y} \|^{2} \Tr \left( \| \mathbf{x} \|^{2} \right)} \\ &= \sqrt{\| \mathbf{y} \|^{2} \| \mathbf{x} \|^{2} } \\ &= \| \mathbf{y} \| \| \mathbf{x} \| \end{align*} $$

그러므로 다음을 얻는다.

$$ \| A \mathbf{x} \| \le \sup\limits_{\| \mathbf{y} \| = 1} \| \mathbf{y} \| \| \mathbf{x} \| \| A \|_{F} = \| A \|_{F} \| \mathbf{x} \| $$

(c)

$\| AB \|_{F}$에 대해서 다음이 성립한다.

$$ \| AB \|_{F} = \sqrt{\Tr \left( (AB)^{\ast} AB \right)} = \sqrt{\Tr \left( B^{\ast} A^{\ast} AB \right)} $$

$A^{\ast}A$는 에르미트 행렬이므로, 유니터리 대각화 $A^{\ast}A = Q^{\ast} D Q$가 가능하다. $C = QB$라 두면 다음을 얻는다.

$$ \| AB \|_{F} = \sqrt{\Tr \left( B^{\ast}Q^{\ast} D QB \right)} = \sqrt{\Tr \left( C^{\ast} D C \right)} $$

$\Tr(C^{\ast} D C)$는 아래와 같다. $\lambda_{i}$를 $A$의 고유값이라 하면,

$$ \Tr(C^{\ast} D C) = \Tr \left( \begin{bmatrix} -\mathbf{c}_{1}^{\ast}- \\ \vdots \\ -\mathbf{c}_{n}^{\ast}- \end{bmatrix} \begin{bmatrix} \lambda_{1}^{2} & & \\ & \ddots & \\ & & \lambda_{n}^{2} \end{bmatrix} \begin{bmatrix} \overset{|}{\underset{|}{\mathbf{c}_{1}}} & \cdots & \overset{|}{\underset{|}{\mathbf{c}_{n}}} \end{bmatrix} \right) = \sum\limits_{i} \lambda_{i}^{2} \| \mathbf{c}_{i} \|^{2} $$

한편 $\| A \|_{F} = \sqrt{\sum\limits_{i} |\lambda_{i}|^{2}}$이고, $\| B \|_{F} = \sqrt{\Tr (C^{\ast}Q Q^{\ast} C)} = \sqrt{\sum\limits_{i} \| \mathbf{c}_{i} \|}$이므로, 다음을 얻는다.

$$ \| AB \|_{F} = \sqrt{\sum\limits_{i} |\lambda_{i}|^{2} \| \mathbf{c}_{i} \|^{2}} \le \sqrt{\sum\limits_{i} |\lambda_{i}|^{2}} \sqrt{\sum\limits_{i} \| \mathbf{c}_{i} \|^{2}} = \| A \|_{F} \| B \|_{F} $$


  1. 김상동. (2012). 수치행렬해석: p44. ↩︎