logo

母平均に対する標本仮説検定 📂統計的検定

母平均に対する標本仮説検定

仮説検証 1

母集団の分布が(μ,σ2)\left( \mu , \sigma^{2} \right)に従ってると仮定しよう。標本が大標本の場合、つまり標本の数がn>30n > 30の時、母平均の候補μ0\mu_{0}に対する仮説検証は以下の通りだ。

  • H0H_{0}: μ=μ0\mu = \mu_{0}だ。つまり、母平均はμ0\mu_{0}だ。
  • H1H_{1}: μμ0\mu \ne \mu_{0}だ。つまり、母平均はμ0\mu_{0}じゃない。

検定統計量

検定統計量は、母標準偏差σ\sigmaを知ってるかどうかによって少し違って計算される。

  • σ\sigmaを知ってる時:母標準偏差σ\sigmaをそのまま使って次の通りだ。 Z=Xμ0σ/n Z = {{ \overline{X} - \mu_{0} } \over { \sigma / \sqrt{n} }}
  • σ\sigmaを知らない時:標本標準偏差ssを使って次の通りだ。 Z=Xμ0s/n Z = {{ \overline{X} - \mu_{0} } \over { s / \sqrt{n} }}

説明

標本平均x\overline{x}が母平均μ0\mu_{0}x=μ=μ0\overline{x} = \mu = \mu_{0}くらいで当てると予想するからといって、適当にx=μ=μ0\overline{x} = \mu = \mu_{0}だと断言できない。統計学のコンセプトっていうのは、全部をまとめて割ったから平均値で、大体信じろというわけじゃなく、仮説検証を通して統計学的にその主張を支持することだ。

導出 2

中心極限定理{Xk}k=1n\left\{ X_{k} \right\}_{k=1}^{n}iid 確率変数であり、確率分布(μ,σ2)\left( \mu, \sigma^2 \right) に従うなら、nn \to \inftyの時 nXnμσDN(0,1) \sqrt{n} {{ \overline{X}_n - \mu } \over {\sigma}} \overset{D}{\to} N (0,1)

母集団の分布が(μ,σ2)\left( \mu , \sigma^{2} \right)だとして大標本と考えた場合、 Z=Xμ0σ/n Z = {{ \overline{X} - \mu_{0} } \over { \sigma / \sqrt{n} }} 標準正規分布N(0,1)N (0,1)にほぼ近似した分布に従う。同様に大標本の場合、sσs \approx \sigmaなので、母分散を知らないときはσ\sigmaの代わりにssを使っても問題ない。確率変数YY標準正規分布に従うとした時、有意水準α\alphaについてP(Yzα)=αP \left( Y \ge z_{\alpha} \right) = \alphaを満たすzαz_{\alpha}についてH0H_{0}が棄却されるということは次と同等だ。 Zzα \left| Z \right| \ge z_{\alpha} これは、帰無仮説に従ってμ=μ0\mu = \mu_{0}と信じるにはX\overline{X}μ0\mu_{0}から遠すぎるという意味になる。

一方、導出過程で大標本という仮定n30n \ge 30nn \to \inftyのように考えられる点に疑問を持つことがあるだろうが、統計の普遍的な世界で’大標本’がこの程度のレベルだと心で受け入れなければならない。2010年代以降ビッグデータという言葉がよく使われ、千や億といった単位が大きく感じないかもしれないが、与えられた母集団が「遺伝子が制御された高価な実験用マウス」や「希少病患者」だと考えると、大標本と呼ぶことが無理ではないという感じがするだろう。


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p347. ↩︎

  2. 경북대학교 통계학과. (2008). 엑셀을 이용한 통계학: p204. ↩︎