母平均に対する標本仮説検定
📂統計的検定母平均に対する標本仮説検定
仮説検証
母集団の分布が(μ,σ2)に従ってると仮定しよう。標本が大標本の場合、つまり標本の数がn>30の時、母平均の候補μ0に対する仮説検証は以下の通りだ。
- H0: μ=μ0だ。つまり、母平均はμ0だ。
- H1: μ=μ0だ。つまり、母平均はμ0じゃない。
検定統計量
検定統計量は、母標準偏差σを知ってるかどうかによって少し違って計算される。
- σを知ってる時:母標準偏差σをそのまま使って次の通りだ。
Z=σ/nX−μ0
- σを知らない時:標本標準偏差sを使って次の通りだ。
Z=s/nX−μ0
説明
標本平均xが母平均μ0をx=μ=μ0くらいで当てると予想するからといって、適当にx=μ=μ0だと断言できない。統計学のコンセプトっていうのは、全部をまとめて割ったから平均値で、大体信じろというわけじゃなく、仮説検証を通して統計学的にその主張を支持することだ。
導出
中心極限定理:{Xk}k=1nがiid 確率変数であり、確率分布(μ,σ2)に従うなら、n→∞の時
nσXn−μ→DN(0,1)
母集団の分布が(μ,σ2)だとして大標本と考えた場合、
Z=σ/nX−μ0
は標準正規分布N(0,1)にほぼ近似した分布に従う。同様に大標本の場合、s≈σなので、母分散を知らないときはσの代わりにsを使っても問題ない。確率変数Yが標準正規分布に従うとした時、有意水準αについてP(Y≥zα)=αを満たすzαについてH0が棄却されるということは次と同等だ。
∣Z∣≥zα
これは、帰無仮説に従ってμ=μ0と信じるにはXがμ0から遠すぎるという意味になる。
■
一方、導出過程で大標本という仮定n≥30がn→∞のように考えられる点に疑問を持つことがあるだろうが、統計の普遍的な世界で’大標本’がこの程度のレベルだと心で受け入れなければならない。2010年代以降ビッグデータという言葉がよく使われ、千や億といった単位が大きく感じないかもしれないが、与えられた母集団が「遺伝子が制御された高価な実験用マウス」や「希少病患者」だと考えると、大標本と呼ぶことが無理ではないという感じがするだろう。