logo

仮説検定の検定力関数 📂数理統計学

仮説検定の検定力関数

定義 1

仮説検定: H0:θΘ0H1:θΘ0c \begin{align*} H_{0} :& \theta \in \Theta_{0} \\ H_{1} :& \theta \in \Theta_{0}^{c} \end{align*}

このような仮説検定が与えられていて、α[0,1]\alpha \in [0,1] とする。

  1. パラメータ θ\theta に対して、棄却域RR の関数 β(θ):=Pθ(XR)\beta (\theta) := P_{\theta} \left( \mathbf{X} \in \mathbb{R} \right)検定力関数power functionという。
  2. supθΘ0β(θ)=α\sup_{\theta \in \Theta_{0}} \beta (\theta) = \alpha の場合、与えられた仮説検定を サイズsize α\alpha の仮説検定という。
  3. supθΘ0β(θ)α\sup_{\theta \in \Theta_{0}} \beta (\theta) \le \alpha の場合、与えられた仮説検定を レベルlevel α\alpha の仮説検定という。

説明

パワー?

数学でパワーと言えば、冪乗 powや冪を覆う、べき字を使って冪関数 f(x)=xαf(x) = x^{-\alpha} と言っていることが多いけど、統計学の文脈では、ただ仮説検定の検定する力powerと考えればいい。

検定力?

β\beta は確率 PθP_{\theta} を通じて定義されるので、当然その値域は [0,1][0,1] の部分集合だ。β(θ)\beta (\theta) の値が大きいということ―検定力、検定する力が強いということは、帰無仮説を棄却する力のことだ。対立仮説を棄却しても検定は検定だろうか?という疑問が生じるかもしれないが、本来どんな仮説検定でも、帰無仮説を基準に話すことが多いし、RR が帰無仮説の棄却域なので、検定とは帰無仮説が棄却されるか否かだけを気にすればいいのだ。

この検定力関数を通じて仮説検定の良し悪しを評価する。もっといい検定方法があれば、それを より強力なmore Powerfulと言うが、ここでの表現から、一般の数学のPowerと違って、本当に力を意味していることがわかる。数理統計学の観点から、どんな仮説検定が合理的か、効率的かを考えるのはとても自然な動機だ。

ただ、単に検定力そのものを良し悪しの指標とするわけにはいかない。例えば、どんなサンプルが入ってきても帰無仮説を棄却してしまう β(θ)=1=100%\beta (\theta) = 1 = 100 \% を考えてみれば、検定力自体はとても強いが、強力すぎて第一種の過誤(帰無仮説が真の場合に棄却してしまう過誤)を全く捕らえることができない。

サイズとレベル

通常はサイズとレベルという言葉を区別せずに使うことが多いが、定義された場合、自然にレベル α\alpha テストの集合がサイズ α\alpha テストの集合を含む。この違いを細かく考察して研究する際は、用語を厳密に区別して使うべきだ。

α\alpha の意味は?サイズであれレベルであれ、α\alpha が高いとは、帰無仮説が真のときに棄却される確率が大きいパラメータがあるということだ。α\alpha が大きければ大きいほど、寛容に帰無仮説を棄却し、もしα\alpha がとても小さければ、非常に保守的な検定となる。このような違いは棄却域によって生じる。一方で レベルlevelとこの説明で 有意水準critical levelが頭に浮かぶのは自然だけど、結局は別の話で、無理に結びつける必要もなく、事実結びつけてはいけない。概念的に受け入れよう。

例: 正規分布

H0:θθ0H1:θ>θ0 \begin{align*} H_{0} :& \theta \le \theta_{0} \\ H_{1} :& \theta > \theta_{0} \end{align*} 分散が既知の正規分布 N(θ,σ2)N \left( \theta , \sigma^{2} \right)ランダムサンプル X1,,XnX_{1} , \cdots , X_{n} に対する上記のような仮説検定を考えると、zスコアがある定数 cc よりも大きければ、帰無仮説を棄却できるだろう。検定力関数 β\beta は、Xˉθ0σ/n\displaystyle {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }} がある確率 PPθ\theta に関する式に変換することで求めることができる。 β(θ)=Pθ(Xˉθ0σ/n>c)=Pθ(Xˉθσ/n>c+θ0θσ/n)=Pθ(Z>c+θ0θσ/n) \begin{align*} \beta \left( \theta \right) =& P_{\theta} \left( {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }} > c \right) \\ =& P_{\theta} \left( {{ \bar{X} - \theta } \over { \sigma / \sqrt{n} }} > c + {{ \theta_{0} - \theta } \over { \sigma / \sqrt{n} }} \right) \\ =& P_{\theta} \left( Z > c + {{ \theta_{0} - \theta } \over { \sigma / \sqrt{n} }} \right) \end{align*} ここで、Z:=Xˉθ0σ/n\displaystyle Z := {{ \bar{X} - \theta_{0} } \over { \sigma / \sqrt{n} }}標準正規分布に従う確率変数だ。


  1. Casella. (2001). Statistical Inference(2nd Edition): p383, 385. ↩︎