二つの母平均の差に関する大標本仮説検定
📂統計的検定二つの母平均の差に関する大標本仮説検定
仮説検定
二つの独立な母集団がそれぞれ(μ1,σ12)と(μ2,σ22)の分布に従うとしよう。標本の数がn1,n2>30の場合、つまり標本が大きい場合、二つの母集合の平均の差に対する候補D0に対する仮説検定は以下の通りだ。
- H0:μ1−μ2=D0だ。つまり、母集団の平均の差はD0だ。
- H1:μ1−μ2=D0でない。つまり、母集団の平均の差はD0ではない。
検定統計量
検定統計量は、母標準偏差σ1,σ2を知っているかどうかによって少し異なって計算される。
- σ1,σ2を知っている場合:母標準偏差σ1,σ2をそのまま使って次のようになる。
Z=n1σ12+n2σ22(X1−X2)−D0
- σ1,σ2を知らない場合:標本標準偏差s1,s2を使って次のようになる。
Z=n1s12+n2s22(X1−X2)−D0
説明
たぶんD0で最もよく使われるのは0だろう、なぜなら「二つの分布の母集平均が同じか」のような核心的な部分が知りたい場合が多いからだ。「正確な差がどの程度か」よりも。検定統計量の形で最も複雑に見えるのは分母にあるn1σ12+n2σ22だが、数理統計学を学んだ後にその導出を知ると、勉強が面白くなる。新入生は残念ながら覚えなければならない。
導出
中心極限定理:{Xk}k=1nがiid確率変数で分布(μ,σ2)に従うとしよう。その場合、n→∞の時
nσX−μ→DN(0,1)
二つの母集団から得た大きな標本だと仮定するので、母集団の分布が何であれ、X1,X2は中心極限定理に従って正規分布に従う。
X1=X2=n11k=1∑n1X1∼N(μ1,n1σ12)n21k=1∑n2X2∼N(μ2,n2σ22)
正規分布の和:確率変数X1,⋯,Xnたちが相互に独立だとしよう。
- Xi∼N(μi,σi2)であれば与えられたベクトル(a1,⋯,an)∈Rnに対して
i=1∑naiXi∼N(i=1∑naiμi,i=1∑nai2σi2)
与えられたベクトル(a1,a2)=(1,−1)∈R2に対して
X1−X2=∼∼a1X1+a2X2N(i=1∑2aiμi,i=1∑2ai2σi2)N(μ1−μ2,12⋅n1σ2+(−1)2⋅n2σ2)
だから帰無仮説H0:μ1−μ2=D0の下で
Z=n1σ12+n2σ22(X1−X2)−D0∼N(0,1)
は標準正規分布N(0,1)にほぼ近似した分布に従う。同様に、標本が大きい場合s≈σ、母集団の分散を知らないときは、σの代わりにsを使用しても問題ない。確率変数Yが標準正規分布に従うとき、有意水準αに対してP(Y≥zα)=αを満たすzαに対してH0が棄却されるのは次のように同等だ。
∣Z∣≥zα
これは帰無仮説のもとでμ1−μ2=D0を信じるにはX1−X2がD0から遠すぎるという意味だ。
■