logo

양정부호 행렬과 확장된 코시-슈바르츠 부등식 증명 📂행렬대수

양정부호 행렬과 확장된 코시-슈바르츠 부등식 증명

정리 1

임의의 두 벡터 b,dRp\mathbf{b}, \mathbf{d} \in \mathbf{R}^{p}양의 정부호 행렬 ARp×pA \in \mathbf{R}^{p \times p} 에 대해 다음의 부등식이 성립한다. (bTd)2(bTAb)(dTA1d) \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} \le \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right) 이것이 등식이 되는 동치조건은 어떤 상수 cRc \in \mathbb{R} 에 대해 b=cA1d\mathbf{b} = c A^{-1} \mathbf{d} 혹은 d=cAb\mathbf{d} = c A \mathbf{b} 와 같이 나타나는 것이다.


설명

이 부등식은 코시-슈바르츠 부등식의 일반화로써, AA항등행렬 II 일 때 원래의 코시-슈바르츠 부등식과 같다. 부등식의 우변에 이차 형식이 등장하고, 자연스럽게 수리통계학에서의 활용도가 높다.

증명

Part 1. 부등식

양정부호 행렬의 역행렬과 제곱근 행렬: 양의 정부호 행렬 AA고유쌍 {(λk,ek)}k=1n\left\{ \left( \lambda_{k} , e_{k} \right) \right\}_{k=1}^{n}λ1>>λn>0\lambda_{1} > \cdots > \lambda_{n} > 0 순으로 정렬되어 있다고 하자. 직교행렬 P=[e1en]Rn×nP = \begin{bmatrix} e_{1} & \cdots & e_{n} \end{bmatrix} \in \mathbb{R}^{n \times n}대각행렬 Λ=diag(λ1,,λn)\Lambda = \diag \left( \lambda_{1} , \cdots , \lambda_{n} \right) 에 대해 AA역행렬 A1A^{-1}제곱근 행렬 A\sqrt{A} 은 다음과 같다. A1=PΛ1PT=k=1n1λkekekTA=PΛPT=k=1nλkekekT \begin{align*} A^{-1} =& P \Lambda^{-1} P^{T} = \sum_{k=1}^{n} {{ 1 } \over { \lambda_{k} }} e_{k} e_{k}^{T} \\ \sqrt{A} =& P \sqrt{\Lambda} P^{T} = \sum_{k=1}^{n} \sqrt{\lambda_{k}} e_{k} e_{k}^{T} \end{align*}

AA 가 양정부호 행렬이면 AA제곱근 행렬A=PΛPT=k=1nλkekekT \sqrt{A} = P \sqrt{\Lambda} P^{T} = \sum_{k=1}^{n} \sqrt{\lambda_{k}} e_{k} e_{k}^{T} 이므로 전치행렬 이어서 A1/2=(A1/2)TA^{1/2} = \left( A^{1/2} \right)^{T} 가 성립하고, 같은 이유로 A1A^{-1} 역시 전치행렬이다.

x:=A1/2b\mathbf{x} := A^{1/2} \mathbf{b} 그리고 y:=A1/2d\mathbf{y} := A^{-1/2} \mathbf{d} 라고 두면 원래의 코시-슈바르츠 부등식 (xTy)(xTx)(yTy)\left( \mathbf{x}^{T} \mathbf{y} \right) \le \left( \mathbf{x}^{T} \mathbf{x} \right) \left( \mathbf{y}^{T} \mathbf{y} \right) 에 따라 (bTd)2=(bTA1/2A1/2d)2=(bT(A1/2)TA1/2d)2=((A1/2b)TA1/2d)2=((A1/2b)TA1/2d)2=(xTy)2(xTx)(yTy)((A1/2b)T(A1/2b))((A1/2d)T(A1/2d))=(bTAb)(dTA1d) \begin{align*} & \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{b}^{T} A^{1/2} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{b}^{T} \left( A^{1/2} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \left( A^{1/2} \mathbf{b} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \left( A^{1/2} \mathbf{b} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{x}^{T} \mathbf{y} \right)^{2} \\ \le & \left( \mathbf{x}^{T} \mathbf{x} \right) \left( \mathbf{y}^{T} \mathbf{y} \right) \\ \le & \left( \left( A^{1/2} \mathbf{b} \right)^{T} \left( A^{1/2} \mathbf{b} \right) \right) \left( \left( A^{-1/2} \mathbf{d} \right)^{T} \left( A^{-1/2} \mathbf{d} \right) \right) \\ =& \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right) \end{align*} 와 같이 일반화할 수 있다.


Part 2. 등식

어떤 상수가 c=0c = 0 이어서 b=0\mathbf{b} = \mathbf{0} 이거나 d=0\mathbf{d} = \mathbf{0} 면 등식은 자명하게 성립한다. 만약 둘 다 영벡터가 아니고, 일반성을 잃지 않고 d=cAb\mathbf{d} = c A \mathbf{b} 라고 가정하면 bTd=bTcAb=cbTAb \begin{align*} \mathbf{b}^{T} \mathbf{d} =& \mathbf{b}^{T} c A \mathbf{b} \\ =& c \mathbf{b}^{T} A \mathbf{b} \end{align*} 도 성립하고 bTd=(1cA1d)Td=1cdTA1d \begin{align*} \mathbf{b}^{T} \mathbf{d} =& \left( {{ 1 } \over { c }} A^{-1} \mathbf{d} \right)^{T} \mathbf{d} \\ =& {{ 1 } \over { c }} \mathbf{d}^{T} A^{-1} \mathbf{d} \end{align*} 도 성립한다. 이렇게 얻은 두 식의 가장 끝 양변끼리 곱하면 다음의 등식을 얻는다. (bTd)2=(bTAb)(dTA1d) \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} = \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right)


  1. Johnson. (2013). Applied Multivariate Statistical Analysis(6th Edition): p117. ↩︎