logo

母平均に対する標本仮説検定 📂統計的検定

母平均に対する標本仮説検定

仮説検証 1

母集団の分布が$\left( \mu , \sigma^{2} \right)$に従ってると仮定しよう。標本が大標本の場合、つまり標本の数が$n > 30$の時、母平均の候補$\mu_{0}$に対する仮説検証は以下の通りだ。

  • $H_{0}$: $\mu = \mu_{0}$だ。つまり、母平均は$\mu_{0}$だ。
  • $H_{1}$: $\mu \ne \mu_{0}$だ。つまり、母平均は$\mu_{0}$じゃない。

検定統計量

検定統計量は、母標準偏差$\sigma$を知ってるかどうかによって少し違って計算される。

  • $\sigma$を知ってる時:母標準偏差$\sigma$をそのまま使って次の通りだ。 $$ Z = {{ \overline{X} - \mu_{0} } \over { \sigma / \sqrt{n} }} $$
  • $\sigma$を知らない時:標本標準偏差$s$を使って次の通りだ。 $$ Z = {{ \overline{X} - \mu_{0} } \over { s / \sqrt{n} }} $$

説明

標本平均$\overline{x}$が母平均$\mu_{0}$を$\overline{x} = \mu = \mu_{0}$くらいで当てると予想するからといって、適当に$\overline{x} = \mu = \mu_{0}$だと断言できない。統計学のコンセプトっていうのは、全部をまとめて割ったから平均値で、大体信じろというわけじゃなく、仮説検証を通して統計学的にその主張を支持することだ。

導出 2

中心極限定理:$\left\{ X_{k} \right\}_{k=1}^{n}$がiid 確率変数であり、確率分布$\left( \mu, \sigma^2 \right) $に従うなら、$n \to \infty$の時 $$ \sqrt{n} {{ \overline{X}_n - \mu } \over {\sigma}} \overset{D}{\to} N (0,1) $$

母集団の分布が$\left( \mu , \sigma^{2} \right)$だとして大標本と考えた場合、 $$ Z = {{ \overline{X} - \mu_{0} } \over { \sigma / \sqrt{n} }} $$ は標準正規分布$N (0,1)$にほぼ近似した分布に従う。同様に大標本の場合、$s \approx \sigma$なので、母分散を知らないときは$\sigma$の代わりに$s$を使っても問題ない。確率変数$Y$が標準正規分布に従うとした時、有意水準$\alpha$について$P \left( Y \ge z_{\alpha} \right) = \alpha$を満たす$z_{\alpha}$について$H_{0}$が棄却されるということは次と同等だ。 $$ \left| Z \right| \ge z_{\alpha} $$ これは、帰無仮説に従って$\mu = \mu_{0}$と信じるには$\overline{X}$が$\mu_{0}$から遠すぎるという意味になる。

一方、導出過程で大標本という仮定$n \ge 30$が$n \to \infty$のように考えられる点に疑問を持つことがあるだろうが、統計の普遍的な世界で’大標本’がこの程度のレベルだと心で受け入れなければならない。2010年代以降ビッグデータという言葉がよく使われ、千や億といった単位が大きく感じないかもしれないが、与えられた母集団が「遺伝子が制御された高価な実験用マウス」や「希少病患者」だと考えると、大標本と呼ぶことが無理ではないという感じがするだろう。


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p347. ↩︎

  2. 경북대학교 통계학과. (2008). 엑셀을 이용한 통계학: p204. ↩︎