独立した二つのカイ二乗分布からF分布を導出する
📂確率分布論独立した二つのカイ二乗分布からF分布を導出する
定理
二つの確率変数U,Vが独立であり、U∼χ2(r1)、V∼χ2(r2)とするならば
V/r2U/r1∼F(r1,r2)
説明
二つのデータがカイ二乗分布に従い、独立である場合、その比率を分布理論で説明することができるかもしれない。統計学全般では、標準化された残差の二乗がカイ二乗分布に従うと仮定されるため、F検定を好んで使用する。証明自体が重要なわけではないが、多くの分析でなぜF検定を使用するのかについての洞察を与えるため、数理統計学を学ぶ統計学生にとっては非常に重要な事実である。
導出
戦略: カイ二乗分布のジョイント密度関数を直接演繹する。
カイ二乗分布の定義: 自由度r>0に対して次のような確率密度関数を持つ連続確率分布χ2(r)はカイ二乗分布と呼ばれる。
f(x)=Γ(r/2)2r/21xr/2−1e−x/2,x∈(0,∞)
F分布の定義: 自由度r1,r2>0に対して次のような確率密度関数を持つ連続確率分布F(r1,r2)はF分布と呼ばれる。
f(x)=B(r1/2,r2/2)1(r2r1)r1/2xr1/2−1(1+r2r1x)−(r1+r2)/2,x∈(0,∞)
U,Vが独立なのでジョインット密度関数はu,v∈(0,∞)に対して次のようになる。
h(u,v)=Γ(2r1)Γ(2r2)2(r1+r2)/21ur1/2−1vr2/2−1e−(u+v)/2
今、W:=V/r2U/r1とZ:=Vとするならばu=(r1/r2)zwであり、v=zなので
∣J∣=(r1/r2)z0(r1/r2)w1=(r1/r2)z=0
従って、W,Zのジョイント密度関数はw,z∈(0,∞)に対して
g(w,z)=Γ(2r1)Γ(2r2)2(r1+r2)/21(r2r1zw)2r1−2z2r2−2exp[−2z(r2r1w+1)]r2r1z
Wのマージナル密度関数g1はy:=2z(r2r1w+1)として
g1(w)=====∫−∞∞g(w,z)dz∫−∞∞Γ(2r1)Γ(2r2)2(r1+r2)/21(r2r1zw)2r1−2z2r2−2exp[−2z(r2r1w+1)]r2r1zdz∫−∞∞Γ(2r1)Γ(2r2)2(r1+r2)/2(r1/r2)r1/2wr1/2−1(r2r1w+12y)2r1+r2−1e−y(r2r1w+12)dyΓ(2r1)Γ(2r2)Γ(2r1+r2)(r2r1)r1/2(1+r2r1w)(r1+r2)/2wr1/2−1B(r1/2,r2/2)1(r2r1)r1/2wr1/2−1(1+r2r1w)−(r1+r2)/2
従って
W∼F(r1,r2)
■