F分布
📂確率分布論F分布
定義
自由度 r1,r2>0 に対して以下の確率密度関数を持つ連続確率分布 F(r1,r2) をF分布という。
f(x)=B(r1/2,r2/2)1(r2r1)r1/2xr1/2−1(1+r2r1x)−(r1+r2)/2,x∈(0,∞)
- B(r1/2,r2/2) はベータ関数を意味する。
基本性質
モーメント生成関数
平均と分散
- [2]: X∼F(r1,r2) の場合
E(X)=Var(X)=r2−2r2r1(r2−2)2(r2−4)2r22(r1+r2−2),r2>2,r2>4
定理
二つの確率変数 U,V が独立で、U∼χ2(r1)、V∼χ2(r2) だとする。
- [a]: d2>2k の場合 F:=V/r2U/r1 はk次のモーメントが存在し、
EFk=(r1r2)kEUkEV−k
- [b]: V/r2U/r1∼F(r1,r2)
- [c]: 自由度 r1,r2 のF分布に従う確率変数 X∼F(r1,r2) に対して次のように定義されたY は、ベータ分布 Best(2r1,2r2) に従う。
Y:=1+(r1/r2)X(r1/r2)X∼Beta(2r1,2r2)
- [d]: 自由度 ν>0 のt分布に従う確率変数 X∼t(ν) に対して次のように定義されたY は、F分布 F(1,ν) に従う。
Y:=X2∼F(1,ν)
相互性reciprocality
- [e]: X∼F(r1,r2) の場合、その逆数の分布は次のようになる。
X1∼F(r2,r1)
- χ2(r) は自由度 r のカイ二乗分布だ。
説明
t分布がスチューデントstudent t分布と呼ばれるように、F分布も統計学者ジョージ・スネデコーの名前を取ってスネデコーsnedecor F分布と呼ばれることがある。
F分布の確率密度関数は一見複雑に見えるが、実際には式を操作する必要はほとんどなく、カイ二乗分布との関係をよく理解することが最優先だ。カイ二乗分布が適合度検定に使用されたように、F分布は二つの母集団の分散を比較する際に使用できる。定理[b]で直接確認できるように、F分布はカイ二乗分布に従うデータの比として表されるため、この統計量が1から遠く離れている場合は、二つの分布の分散が異なると推測できるのだ。
証明
確率変数のモーメント生成関数が存在するとは、すべてのk∈N に対してk次のモーメントが存在することを意味する。しかし、定理[a]でのF分布のk次のモーメントはk<d2/2 のときに存在するため、モーメント生成関数は存在しえない。
■
[2]
定理[a]に記載されたモーメント公式を使用する。
■
[a]
t=r2r1x と置換するとdt=r2r1dx となるので、
EFk=====∫0∞xkB(r1/2,r2/2)1(r2r1)r1/2xr1/2−1(1+r2r1x)−(r1+r2)/2dxB(r1/2,r2/2)1(r2r1)r1/2∫0∞xk+r1/2−1(1+r2r1x)−(r1+r2)/2dxB(r1/2,r2/2)1(r2r1)r1/2∫0∞(r1r2t)k+r1/2−1(1+t)−(r1+r2)/2r1r2dtB(r1/2,r2/2)1(r2r1)r1/2(r1r2)k+r1/2∫0∞tk+r1/2(1+t)−r1/2−r2/2dtB(r1/2,r2/2)1(r1r2)k∫0∞tk+r1/2(1+t)−(r1/2+k)−(r2/2−k)dt
ベータ関数の定積分形式の表示:
B(p,q)=∫0∞(1+t)p+qtp−1dt
ベータ関数とガンマ関数の関係:
B(p,q)=Γ(p+q)Γ(p)Γ(q)
EFk====B(r1/2,r2/2)1(r1r2)kB(2r1+k,2r2−k)(r1r2)kΓ(r1/2)Γ(r2/2)Γ(r1/2+r2/2)Γ(r1/2+k+r2/2−k)Γ(r1/2+k)Γ(r2/2−k)(r1r2)kΓ(r1/2)Γ(r2/2)11Γ(r1/2+k)Γ(r2/2−k)(r1r2)kΓ(r1/2)Γ(r1/2+k)2kΓ(r2/2)2−kΓ(r2/2−k)
カイ二乗分布のモーメント: X∼χ2(r) とする。k>−r/2 の場合、k次のモーメントが存在する
EXk=Γ(r/2)2kΓ(r/2+k)
EFk=(r1r2)kEUkEV−k
■
[b]
ジョイント密度関数から直接導く。
■
[c]
変数変換で直接導く。
■
[d]
カイ二乗分布の比として遠回りする。
■
[e]
分子と分母が逆転しているので、定理[b]に従って自明だ。実用的な統計学者の視点からは、定理[b]に従ってF分布を定義し、それに基づいて確率密度関数を導出する方が自然だ。
■
参照