ピアソンの定理の証明
📂確率分布論ピアソンの定理の証明
定理
i=1∑kNi=n&i=1∑kpi=1を満たすp=(p1,⋯,pk)∈[0,1]kとサンプルサイズn∈N、k∈N個のカテゴリについて、ランダムベクトル(N1,⋯,Nk)が多項分布Mk(n;p)に従うとする。このときn→∞であるならば、統計量Sはカイ二乗分布χ2(k−1)に分布収束する。
S:=j=1∑knpj(Nj−npj)2→Dχ2(k−1)
- [0,1]k=[0,1]×⋯×[0,1]はk-セルである。
- →Dは分布収束を意味する。
- χ2(r)は自由度rのカイ二乗分布を意味する。
説明
正直に言うと、ピアソンの定理という表現がよく使われるわけではない。本当に1回しか見たことがないけど、普通は統計量
X2:=j=1∑kEj(Oj−Ej)2
をピアソンのカイ二乗統計量pearson Chi-squared statisticと呼び、これがカイ二乗分布に分布収束するというステートメントだけで紹介されるからだ。定理という認識を持って学ぶよりも実用的な仮説検定の話にすぐ移るので、厳密な数理的証明を軽視されがちだ。
証明
全ての成分がpj>0であるpと
S:=j=1∑knpj(Xj−npj)2
としよう。制約条件∑j=1k(Nj−npj)=0に従って最後のk番目の項を除くと、
S===j=1∑knpj(Xj−npj)2j=1∑k−1npj(Xj−npj)2+npk(Xk−npk)2j=1∑k−1npj(Xj−npj)2+npk(∑j=1k−1(Xj−npj))2
が得られる。このように制約条件がある場合、実際にはNkは必要なく、k番目の成分が切り取られたN:=(N1,⋯,Nk−1)とp:=(p1,⋯,pk−1)について、Nの共分散行列Σを考えたい。
多項分布の共分散行列: ランダムベクトルX:=(X1,⋯,Xk)が多項分布Mk(n,p)に従うならば、共分散行列は次のようになる。
Cov(X)=np1(1−p1)−p2p1⋮−pkp1−p1p2p2(1−p2)⋮−pkp2⋯⋯⋱⋯−p1pk−p2p2⋮pk(1−pk)
k番目の成分があってもなくてもCov(Ni,Nj)が変わる理由はないので、恒等行列Ik−1に対して次を得る。
======n1Σn1Cov(N)p1(1−p1)−p2p1⋮−pk−1p1−p1p2p2(1−p2)⋮−pk−1p2⋯⋯⋱⋯−p1pk−1−p2p2⋮pk−1(1−pk−1)p10⋮00p2⋮0⋯⋯⋱⋯00⋮pk−1−−p12−p2p1⋮−pk−1p1−p1p2−p22⋮−pk−1p2⋯⋯⋱⋯−p1pk−1−p2p2⋮−pk−12p10⋮00p2⋮0⋯⋯⋱⋯00⋮pk−1−p1p2⋮pk−1[p1p2⋯pk−1]p10⋮00p2⋮0⋯⋯⋱⋯00⋮pk−1−ppTIk−1p−ppT
ここで、pTはpの転置行列を意味する。ここでP:=Ik−1pとする。
シャーマン-モリソン公式: (A+uvT)−1が存在する場合、具体的な公式は以下の通りである。
(A+uvT)−1=A−1−1+vTA−1uA−1uvTA−1
n1Σの逆行列を計算すれば、
P=Ik−1p=diag(p1,⋯,pk−1)
の逆行列は対角成分を逆数にした対角行列P−1=diag(p1−1,⋯,pk−1−1)なので、シャーマン-モリソン公式によれば、
=======(n1Σ)−1(P+(−ppT))−1P−1+1−pTP−1pP−1ppTP−1P−1+1−Ik−1pIk−1Ik−1P−1+1−Ik−1pIk−1Ik−1P−1+1−p1−⋯−pk−11Ik−1P−1+pk1Ik−1p11+pk100⋮00p21+pk10⋮000p31+pk1⋮0⋯⋯⋯⋱⋯000⋮pk−11+pk1
再びSに戻り、行列形式で表すと、
S====j=1∑k−1npj(Xj−npj)2+npk(∑j=1k−1(Xj−npj))2n1[j=1∑k−1(Xj−npj)pj1(Xj−npj)+j=1∑k−1(Xj−npj)pk1j=1∑k−1(Xj−npj)]n1(N−np)T(n1Σ)−1(N−np)(N−np)T(Σ−1)(N−np)
ド・モアブル-ラプラスの定理: Xi∼B(1,p)かつYn=X1+X2+⋯+Xnであれば、Yn∼B(n,p)であり、
np(1−p)Yn−np→DN(0,1)
既にΣがNの共分散行列であることを知っているので、
(N−np)∼(0,Σ)
ド・モアブル-ラプラスの定理により、多変量正規分布Nk−1に対して以下のように表せる。
Σ−1/2(N−np)→DNk−1(0,Ik−1)
この時点で、分布収束して標準正規分布に従う各成分をZj∼N(0,1)で表し、Sの特性関数をϕと定義しよう。(Z1,⋯,Zk−1)の共分散行列がIk−1なので、i=jの時、ZiとZjはもちろん独立である。
レヴィの連続性定理: 可測空間(Rd,B(Rd))が与えられているとする。n∈Nに対する確率測度をμnとし、それに対応する特性関数をφnと表す。次の2つは等価である。
- (a): μnがμ∞に弱く収束する。
- (b): 全てのt∈Rdに対して
n→∞limφn(t)=φ∞(t)
ϕはn→∞の時、レヴィの連続性定理によりZ∼N(0,1)に対して
ϕ(t)==→D=E[eitS]E[exp(it(N−np)TΣ−1(N−np))]E[exp(it(Z12+⋯+Zk−12))][E[exp(itZ2)]]k−1
カイ二乗分布の性質:
- 標準正規分布の二乗との関係: X∼N(μ,σ2)ならば
V=(σX−μ)2∼χ2(1)
- モーメント生成関数: m(t)=(1−2t)−r/2,t<21
ϕ(t)→D==[E[exp(itZ2)]]k−1[(1−2it)1/21]k−1(1−2it)−(k−1)/2
従って、Sはカイ二乗分布χ2(k−1)に分布収束する。
■