logo

二つの母平均の差に対する小標本仮説検定 📂統計的検定

二つの母平均の差に対する小標本仮説検定

仮説検証 1

互いに独立した二つの母集団がそれぞれ正規分布N(μ1,σ12)N \left( \mu_{1} , \sigma_{1}^{2} \right)N(μ2,σ22)N \left( \mu_{2} , \sigma_{2}^{2} \right)に従っておりσ12=σ2=σ22\sigma_{1}^{2} = \sigma^{2} = \sigma_{2}^{2}、つまり、それぞれの母分散を知ることはできないが、等しいとする。標本が少標本であり、標本の数がn1,n2<30n_{1} , n_{2} < 30の場合、二つの母平均の差に関する仮説D0D_{0}の検討は次の通りだ。

  • H0H_{0}: μ1μ2=D0\mu_{1} - \mu_{2} = D_{0}。つまり、母平均の差はD0D_{0}だ。
  • H1H_{1}: μ1μ2=D0\mu_{1} - \mu_{2} = D_{0}じゃない。つまり、母平均の差はD0D_{0}じゃない。

検定統計量

検定統計量標本標準偏差s1,s2s_{1}, s_{2}を使って次のようになる。 t=(X1X2)D0sp2(1n1+1n2) t = {{ \left( \overline{X}_{1} - \overline{X}_{2} \right) - D_{0} } \over { \sqrt{ s_{p}^{2} \left( {{ 1 } \over { n_{1} }} + {{ 1 } \over { n_{2} }} \right) } }} ここで、sp2s_{p}^{2}は次のように計算される標本合同分散だ。 sp2=(n11)s12+(n21)s22n1+n22 s_{p}^{2} = {{ \left( n_{1} - 1 \right) s_{1}^{2} + \left( n_{2} - 1 \right) s_{2}^{2} } \over { n_{1} + n_{2} - 2 }} この検定統計量はt-分布に従うが、その自由度df\mathrm{df}床関数\lfloor \cdot \rfloorに基づいて次のように計算される。 df=(s12n1+s22n2)2(s12/n1)2n11+(s22/n2)2n21 \mathrm{df} = \left\lfloor {{ \left( {{ s_{1}^{2} } \over { n_{1} }} + {{ s_{2}^{2} } \over { n_{2} }} \right)^{2} } \over { {{ \left( s_{1}^{2} / n_{1} \right)^{2} } \over { n_{1} - 1 }} + {{ \left( s_{2}^{2} / n_{2} \right)^{2} } \over { n_{2} - 1 }} }} \right\rfloor

導出

戦略:基本的に、新入生はもちろん、ある程度経験を積んだ学部生でも理解は難しく、修士以上のレベルでは直感的に理解できるものだ。逆に言えば、そこまで勉強していれば、実は補助定理をいくつか並べるだけで済む。


標本合同分散: 各母分散を知ることはできないが等しいとすることができる時、母分散に対する不偏推定量は次の通りだ。 Sp2:=(n11)S12++(nm1)Sm2(n11)++(nm1)=i=1m(ni1)Si2i=1m(ni1) S_{p}^{2} := {{ \left( n_{1} - 1 \right) S_{1}^{2} + \cdots + \left( n_{m} - 1 \right) S_{m}^{2} } \over { \left( n_{1} - 1 \right) + \cdots + \left( n_{m} - 1 \right) }} = {{ \sum_{i=1}^{m} \left( n_{i} - 1 \right) S_{i}^{2} } \over { \sum_{i=1}^{m} \left( n_{i} - 1 \right) }}

セータースウェイト近似: k=1,,nk = 1, \cdots , nとしYkχrk2Y_{k} \sim \chi_{r_{k}}^{2}akRa_{k} \in \mathbb{R}とする。あるν>0\nu > 0に対して k=1nakYkχν2ν \sum_{k=1}^{n} a_{k} Y_{k} \sim {{ \chi_{\nu}^{2} } \over { \nu }} と仮定すれば、その推定量として次のν^\hat{\nu}を使うことができる。 ν^=(kakYk)2kak2rkYk2 \hat{\nu} = {{ \left( \sum_{k} a_{k} Y_{k} \right)^{2} } \over { \sum_{k} {{ a_{k}^{2} } \over { r_{k} }} Y_{k}^{2} }}

独立な正規分布とカイ二乗分布からのスチューデントのt-分布の導出: 二つの確率変数W,VW,V独立でありWN(0,1)W \sim N(0,1)Vχ2(r)V \sim \chi^{2} (r)とすると T=WV/rt(r) T = { {W} \over {\sqrt{V/r} } } \sim t(r)

t=(X1X2)D0sp2(1n1+1n2)=(X1X2)D0σ/1n1+1n2dfsp2σ2/df t = {{ \left( \overline{X}_{1} - \overline{X}_{2} \right) - D_{0} } \over { \sqrt{ s_{p}^{2} \left( {{ 1 } \over { n_{1} }} + {{ 1 } \over { n_{2} }} \right) } }} = {{ { \left( \overline{X}_{1} - \overline{X}_{2} \right) - D_{0} } \over { \displaystyle \sigma / \sqrt{ {{ 1 } \over { n_{1} }} + {{ 1 } \over { n_{2} }} } } } \over { \sqrt{ \displaystyle {{ \textrm{df} s_{p}^{2} } \over { \sigma^{2} }} / \textrm{df} } }} セータースウェイト近似によると、右側の分母は自由度df\mathrm{df}カイ二乗分布に従い、分子は標準正規分布に従い、ttは近似的に自由度df\mathrm{df}t-分布に従う。確率変数YYt-分布t(df)t(\mathrm{df})に従うとすると、有意水準α\alphaにおいてP(Ytα)=αP \left( Y \ge t_{\alpha} \right) = \alphaを満たすtαt_{\alpha}に対してH0H_{0}が棄却されるということは次の通りだ。 ttα \left| t \right| \ge t_{\alpha} これは、帰無仮説に従ってμ1μ2=D0\mu_{1} - \mu_{2} = D_{0}と信じるにはX1X2\overline{X}_{1} - \overline{X}_{2}D0D_{0}から遠くにあるという意味になる。


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p400. ↩︎