クレイグの定理の証明
📂数理統計学クレイグの定理の証明
定理
サンプル X=(X1,⋯,Xn) は X1,⋯,Xn∼iidN(0,σ2) と同様に iid で 正規分布 に従うと仮定する。対称行列 A,B∈Rn×n に対して 確率変数 Q1 と Q2 が ランダムベクトル二次形式 Q1:=σ−2XTAX 及び Q2:=σ−2XTBX として定義されている場合、次のことが成立する。
Q1⊥Q2⟺AB=On
つまり、Q1 と Q2 が 独立 であることと 同値条件 は AB=On である。
- On はサイズが n×n の 零行列 である。
定理
この定理は ホッグ-クレイグの定理の証明 に用いられる。
証明
0n を n次元 零ベクトル、In を n×n 単位行列 と定義する。 rankA=r≤n で rankB=s≤n とし、A の 0 でない 固有値 を λ1,⋯,λr と置く。
スペクトル理論: もし A が エルミート行列 であれば、ユニタリ対角化可能である:
A=A∗⟹A=Q∗ΛQ
実数行列 A は対称行列であるため エルミート行列 であり、そのスペクトル分解 Γ1TΛ1Γ1 が存在する。一般性を失わずに、Λ1 の最初の r 個の対角成分は固有値 λ1,⋯,λr であり、残りは 0 とする。Γ1T∈Rn×n の部分行列を Γ11T∈Rn×r とする時、Λ1 の部分行列は Λ11=diag(λ1,⋯,λr) となる。この表記に従って A は以下のように二つの方法で表される。
A=Γ1TΛ1Γ1=Γ11TΛ11Γ11
ランダムベクトル W1 を W1=σ−1Γ11X と定義すると、Q1 は次のように表される。
Q1====σ−2XTAXσ−2XTΓ11TΛ11Γ11X(σ−1Γ11X)TΛ11(σ−1Γ11X)W1TΛ11W1
同様の過程を経て、ランク が s の B に対して Q2 を次のように表す。
B==⟹Q2=Γ2TΛ2Γ2Γ21TΛ22Γ21W2TΛ22W2,Λ22∈Rs×s,W2:=σ−1Γ21X
ここで W:=[W1W2] と定めると以下のように表現できる。
W=σ−1[Γ11Γ21]X
多変量正規分布の線形変換の正規性: 行列 A∈Rm×n と ベクトル b∈Rm に対し 多変量正規分布 に従う ランダムベクトル X∼Nn(μ,Σ) の 線形変換 Y=AX+b は依然として多変量正規分布 Nm(Aμ+b,AΣAT) に従う。
サンプル X は n-変量正規分布 Nn(0n,In) に従うため、その 線形変換 である W もまた平均が 0r+s で共分散行列が次のような (r+s)-変量正規分布に従う。
VarW=[IrΓ21Γ11TΓ11Γ21TIs]
次に A と B の 積 AB は U:=Γ11TΛ11 と V:=Λ22Γ21 に対して下記のように表される。
AB====Γ11TΛ11Γ11⋅Γ21TΛ22Γ21[Γ11TΛ11]Γ11Γ21T[Λ22Γ21]UΓ11Γ21TVU[Γ11Γ21TV]
(⟸) が AB=On であると仮定する。
U=Γ11TΛ11 は フルランク なので U の カーネル は零ベクトルのみを含む自明なベクトル空間 {0r} であり、次を満たすためには Γ11Γ21TV が零行列でなければならない。
On=AB=U[Γ11Γ21TV]
一方、V もまたフルランクであるため、次を満たすには Γ21Γ11T が零行列でなければならない。
VTΓ21Γ11T=Os
BTAT=On についても同じ論理で Γ11Γ21T が零行列であることを示せるので、W の共分散行列は次のようである。
VarW=[IrΓ21Γ11TΓ11Γ21TIs]=[IrOOIs]
多変量正規分布における独立とゼロ相関は等価である:
X=μ=Σ=[X1X2][μ1μ2][Σ11Σ21Σ12Σ22]:Ω→Rn∈Rn∈Rn×n
上記のように ジョルダンブロックフォーム を用いて表す X, μ, Σ に対し 多変量正規分布 に従う ランダムベクトル X∼Nn(μ,Σ) が与えられたとすると次が成立する。
X1⊥X2⟺Σ12=Σ21=O
定理からサンプル X が正規性を持つため W1⊥W2 であり、それらの関数として表現される Q1=W1TΛ11W1 と Q2=W2TΛ22W2 も互いに独立であることがわかる。
(⟹) が Q1⊥Q2 であると仮定する。
Q1 と Q2 が独立であれば、(0,0) の近傍にある (t1,t2) に対して次が成立する。
E[exp(t1Q1+t2Q2)]=E(expt1Q1)⋅E(expt2Q2)
ここで t1Q1+t2Q2 は次のように表現できる。
==t1Q1+t2Q2t1XTAX+t2XTBXXT(t1A+t2B)X
ここで t1A+t2B は依然として対称行列であるため t1Q1+t2Q2 もまたランダムベクトル二次形式である。
正規分布ランダムベクトル二次形式のモーメント生成関数: サンプル X=(X1,⋯,Xn) が X1,⋯,Xn∼iidN(0,σ2) のように iid で 正規分布 に従うと仮定する。 ランク が r≤n の 対称行列 A∈Rn×n に対する ランダムベクトル二次形式 Q=σ−2XTAX の モーメント生成関数 は次のようになる。
MQ(t)=i=1∏r(1−2tλi)−1/2=det(In−2tA)−1/2,∣t∣<1/2λ1
ここで In∈Rn×n は 単位行列、det は 行列式 である。 λ1≥⋯≥λr は A の 0 でない 固有値 を一般性を失わずに降順に並べたものである。
直交行列の特性: 直交行列の行列式は 1 もしくは −1 である。
直交行列 Γ1 の行列式は ±1 であり、
1=detIn=detΓ1TdetΓ1
従って 1 であれ −1 であれ Γ1 と Γ1T の行列式は符号が一致する。従って t1Q1+t2Q2 のモーメント生成関数は次のように表現される。
====(E[exp(t1Q1+t2Q2)])−2det(In−2t1A−2t2B)det(Γ1TΓ1−2t1Γ1TΛ1Γ1−2t2Γ1TΓ1BΓ1TΓ1)detΓ1Tdet(In−2t1Λ1−2t2Γ1BΓ1T)detΓ1Tdet(In−2t1Λ1−2t2D)
ここで D=Γ1BΓ1T∈Rr×r を以下のように ブロック行列 として表現しよう。
D=[D11D21D12D22]
D をそのままにして Q1 のモーメント生成関数と Q2 のモーメント生成関数の積を書くと次のようになる。
=[E(expt1Q1)⋅E(expt2Q2)]−2i=1∏r(1−2t1λi)det(In−2t2D)
今までの展開を簡単に要約すると以下を得る。
det(In−2t1Λ1−2t2D)=i=1∏r(1−2t1λi)det(In−2t2D)
ここで本当に行列式を計算してすべての項を見る必要はなく、t1 の累乗のみを見ればよい。右辺では (−2t1)r の係数が ∏i=1rλidet(In−2t2D) であることは簡単に分かるが、左辺はそれに比べて容易ではない。まず行列式内の行列を D のブロックを基準に分けて考えたい。Λ1 は Λ1=[Λ11OOO] として表せるので、D11 に該当する部分を det(Ir−2t1Λ11−2t2D11) とし、その残りを det(In−r−2t2D22) とする。ここで最終的に (−2t1)r の係数は ∏i=1rλidet(In−2−2t2D22) であることがわかり、両辺で t1 のみの係数を比較すると以下を得る。
det(In−r−2t2D22)=det(In−2t2D)
ここで次の2つを主張したい:
- D22 と D の 0 でない固有値は等しい。
- 対称実数行列の成分ごとの二乗の和は固有値の二乗和と等しい。
Claim 1. D22 と D の 0 でない固有値は等しい。
行列式の性質: A,Bを n×n行列、kを定数とするとき 行列式 は以下の性質を満足する。
- (a) det(kA)=kndet(A)
λ=0 を λ:=(2t2)−1 と仮定すると以下の等式を得る。
⟹⟹det(In−r−λ1D22)=det(In−λ1D)(−λ)r⋅(−λ)n−rdet(In−r−λ1D22)=(−λ)ndet(In−λ1D)(−λ)rdet(D22−λIn−r)=det(D−λIn)
固有値の同値条件: λ が A の固有値であることと同値条件は次の通り。
det(A−λI)=0
結局 λ=0 は det(D22−λIn−r)=0 及び det(D−λIn)=0 を同時に満たすため D22 と D の固有値は等しい。
Claim 2. 対称実数行列の成分別二乗の和は固有値の二乗和と等しい。
対角化可能な行列の累乗の対角和: 対角化可能 な 行列 A∈Cn×n と 自然数 k∈N が与えられたとする。 A の 固有値 を λ1,⋯,λn とした場合、以下が成り立つ。
trAk=i=1∑nλik
ここで tr は トレース である。
対称行列 M=(mij) の成分の二乗の和は 行列の累乗の対角和 trMTM で表現できるため、次が成立する。
i,j∑mij2=trMTM=trM2=l=1∑nλl2
D と D22 はその定義から対称行列であり実数行列であるため対角化可能である。2つの行列の成分別二乗和はそれぞれの行列の固有値の二乗和と等しいため、D の成分別二乗和と D22 の成分別二乗和は等しくなければならない。ところが両行列とも実数行列であるため、D11 と D12、D21 のすべてが零行列でなければならない。Λ1 と D の積を計算すると
Λ1D=[Λ11OOOn−r][OrOOD22]=On
だが、一方では A=Γ1TΛ1Γ1 で D=Γ1BΓ1T なので次のように AB=On を得る。
===ABΓ1TΛ1Γ1Γ1TDΓ1Γ1TΛ1DΓ1On
■