logo

正定値半不定行列と拡張されたコーシー・シュワルツの不等式の証明 📂行列代数

正定値半不定行列と拡張されたコーシー・シュワルツの不等式の証明

定理 1

任意の二つのベクトルb,dRp\mathbf{b}, \mathbf{d} \in \mathbf{R}^{p}と正定値行列ARp×pA \in \mathbf{R}^{p \times p}に対して、以下の不等式が成立する。 (bTd)2(bTAb)(dTA1d) \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} \le \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right) これが等式になる同値条件はある定数cRc \in \mathbb{R}に対してb=cA1d\mathbf{b} = c A^{-1} \mathbf{d}またはd=cAb\mathbf{d} = c A \mathbf{b}として表されることである。


  • XTX^{T}は行列XXの転置行列である。

説明

この不等式はコーシー・シュワルツの不等式の一般化であり、AAが恒等行列IIのとき元のコーシー・シュワルツの不等式と同じになる。不等式の右辺に二次形式が登場し、自然に数理統計学での応用範囲が広い。

証明

Part 1. 不等式

正定値行列の逆行列と平方根行列: 正定値行列AAの固有対{(λk,ek)}k=1n\left\{ \left( \lambda_{k} , e_{k} \right) \right\}_{k=1}^{n}λ1>>λn>0\lambda_{1} > \cdots > \lambda_{n} > 0の順で整列されているとする。直交行列P=[e1en]Rn×nP = \begin{bmatrix} e_{1} & \cdots & e_{n} \end{bmatrix} \in \mathbb{R}^{n \times n}と対角行列Λ=diag(λ1,,λn)\Lambda = \diag \left( \lambda_{1} , \cdots , \lambda_{n} \right)に関してAAの逆行列A1A^{-1}と平方根行列A\sqrt{A}は以下のようになる。 A1=PΛ1PT=k=1n1λkekekTA=PΛPT=k=1nλkekekT \begin{align*} A^{-1} =& P \Lambda^{-1} P^{T} = \sum_{k=1}^{n} {{ 1 } \over { \lambda_{k} }} e_{k} e_{k}^{T} \\ \sqrt{A} =& P \sqrt{\Lambda} P^{T} = \sum_{k=1}^{n} \sqrt{\lambda_{k}} e_{k} e_{k}^{T} \end{align*}

AAが正定値行列ならばその平方根行列は A=PΛPT=k=1nλkekekT \sqrt{A} = P \sqrt{\Lambda} P^{T} = \sum_{k=1}^{n} \sqrt{\lambda_{k}} e_{k} e_{k}^{T} となり、従って転置行列であるからA1/2=(A1/2)TA^{1/2} = \left( A^{1/2} \right)^{T}が成立し、同じ理由でA1A^{-1}も転置行列である。

x:=A1/2b\mathbf{x} := A^{1/2} \mathbf{b}y:=A1/2d\mathbf{y} := A^{-1/2} \mathbf{d}とすると元のコーシー・シュワルツの不等式(xTy)(xTx)(yTy)\left( \mathbf{x}^{T} \mathbf{y} \right) \le \left( \mathbf{x}^{T} \mathbf{x} \right) \left( \mathbf{y}^{T} \mathbf{y} \right)に従って (bTd)2=(bTA1/2A1/2d)2=(bT(A1/2)TA1/2d)2=((A1/2b)TA1/2d)2=((A1/2b)TA1/2d)2=(xTy)2(xTx)(yTy)((A1/2b)T(A1/2b))((A1/2d)T(A1/2d))=(bTAb)(dTA1d) \begin{align*} & \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{b}^{T} A^{1/2} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{b}^{T} \left( A^{1/2} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \left( A^{1/2} \mathbf{b} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \left( A^{1/2} \mathbf{b} \right)^{T} A^{-1/2} \mathbf{d} \right)^{2} \\ =& \left( \mathbf{x}^{T} \mathbf{y} \right)^{2} \\ \le & \left( \mathbf{x}^{T} \mathbf{x} \right) \left( \mathbf{y}^{T} \mathbf{y} \right) \\ \le & \left( \left( A^{1/2} \mathbf{b} \right)^{T} \left( A^{1/2} \mathbf{b} \right) \right) \left( \left( A^{-1/2} \mathbf{d} \right)^{T} \left( A^{-1/2} \mathbf{d} \right) \right) \\ =& \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right) \end{align*} として一般化できる。


Part 2. 等式

ある定数がc=0c = 0であればb=0\mathbf{b} = \mathbf{0}またはd=0\mathbf{d} = \mathbf{0}で等式が自明に成立する。両方がゼロベクトルでなく、一般性を失わずにd=cAb\mathbf{d} = c A \mathbf{b}と仮定すると bTd=bTcAb=cbTAb \begin{align*} \mathbf{b}^{T} \mathbf{d} =& \mathbf{b}^{T} c A \mathbf{b} \\ =& c \mathbf{b}^{T} A \mathbf{b} \end{align*} も成立し bTd=(1cA1d)Td=1cdTA1d \begin{align*} \mathbf{b}^{T} \mathbf{d} =& \left( {{ 1 } \over { c }} A^{-1} \mathbf{d} \right)^{T} \mathbf{d} \\ =& {{ 1 } \over { c }} \mathbf{d}^{T} A^{-1} \mathbf{d} \end{align*} も成立する。これによって得られた二つの式の両端を乗じると次の等式を得る。 (bTd)2=(bTAb)(dTA1d) \left( \mathbf{b}^{T} \mathbf{d} \right)^{2} = \left( \mathbf{b}^{T} A \mathbf{b} \right) \left( \mathbf{d}^{T} A^{-1} \mathbf{d} \right)


  1. Johnson. (2013). Applied Multivariate Statistical Analysis(6th Edition): p117. ↩︎