カイ二乗分布
📂確率分布論カイ二乗分布
定義
自由度 r>0に対して、以下のような確率密度関数を持つ連続確率分布 χ2(r)をカイ二乗分布chi-square distributionと言う。
f(x)=Γ(r/2)2r/21xr/2−1e−x/2,x∈(0,∞)
基本性質
モーメント生成関数
- [1]: m(t)=(1−2t)−r/2,t<21
- [2] 平均と分散がX∼χ2(r)である場合、
E(X)=Var(X)=r2r
- [3]: カイ二乗分布に従うランダムサンプル X:=(X1,⋯,Xn)∼χ2(r)が与えられたとする。rに対する十分統計量 Tは次の通り。
T=(i∏Xi)
定理
- [a]: X∼χ2(r)とする。k>−r/2の場合、k次モーメントが存在し、
EXk=Γ(r/2)2kΓ(r/2+k)
- [b]: Γ(2r,2)⟺χ2(r)
- [c]: 2つの確率変数U,Vが独立であり、U∼χ2(r1)、V∼χ2(r2)である場合、
V/r2U/r1∼F(r1,r2)
- [d]: X∼N(μ,σ2)の場合、
V=(σX−μ)2∼χ2(1)
説明
カイ二乗分布は、統計学全般で広く使用される分布で、特に適合度検定や分散分析などで最初に遭遇することが多い。
定理[d]は特に重要で、この定理の逆命題によって、標準化された残差residualsの二乗がカイ二乗分布χ2(1)に従わない場合、残差の正規性に問題があることを検出することができる。
証明
戦略 [1], [a]: 置換積分を通じて定積分記号の中にある物を外へ出し、ガンマ関数に変えるトリックを使用する。
ガンマ関数の定義:
Γ(x):=∫0∞yx−1eydy
[1]
y=x(1/2−t)のように置換すると、1/2−t1dy=dxであるため、
m(t)=====∫0∞etxΓ(r/2)2r/21xr/2−1e−x/2dxΓ(r/2)2r/21∫0∞xr/2−1ex(1/2−t)dxΓ(r/2)2r/21∫0∞(1/2−ty)r/2−1ey1/2−t1dy(1/2−t)−r/2Γ(r/2)2r/21∫0∞yr/2−1eydy(1−2t)−r/2Γ(r/2)1∫0∞yr/2−1eydy
ガンマ関数の定義により、
m(t)=(1−2t)−r/2,t<21
■
[2]
モーメント公式[a]に代入する。
■
[a]
y=x/2のように置換すると、2dy=dxであるため、
EXk====∫0∞xkΓ(r/2)2r/21xr/2−1e−x/2dxΓ(r/2)2r/21∫0∞xr/2+k−1e−x/2dxΓ(r/2)2r/21∫0∞2r/2+k−1yr/2+k−1e−y2dyΓ(r/2)2k∫0∞y(r/2+k)−1e−y2dy
ガンマ関数の定義により、
EXk=Γ(r/2)2kΓ(r/2+k)
■
[b]
モーメント生成関数で示される。
■
[c]
ジョイント密度関数で直接演繹する。
■
[d]
確率密度関数で直接演繹する。
■
参照