数理統計的な仮説検定の定義
定義 1
- パラメーターに関する命題を仮説hypothesisという。
- 与えられたサンプルに基づき仮説$H_{0}$を真と受け入れるか、仮説$H_{0}$を棄却して$H_{1}$を採用する問題を仮説検定hypothesis testという。仮説検定では補足的な仮説$H_{0}$、$H_{1}$をそれぞれ帰無仮説null hypothesis、対立仮説alternative hypothesisと呼ぶ。
- 帰無仮説$H_{0}$を棄却するような、サンプル空間 $\Omega$の部分集合$R \subset \Omega$を棄却域rejection regionという。
説明
統計学科でなくても、新入生レベルの統計学に触れることで仮説検定についての説明を受ける。それだけで十分と感じる人も多いが、上の定義はできるだけ数学的に、あいまいさなく、精密に仮説検定を説明している。
以下の説明は、読者がすでに仮説検定というコンセプトにある程度慣れているという前提で書かれている。数理統計的に概念を掴もう。
仮設
定義によれば、仮説はただの’言葉’ではなく、命題である。パラメーターに関する命題であるという言及が重要である。例えば「正規性検定」のようにその命名自体はパラメーターではなく分布そのものに対する検定のように見える場合でも、詳しく見ると必ずパラメーターが隠されている。例として、ハーク-ベラ・テストは正規性検定であり、実は歪度と尖度を通じて仮説検定を行う。
仮説検定
「採用する」と下線が引かれているが、注意を促す意味である。ご存知の通り、ほとんどの教科書ではRejectとAcceptという表現を両方使用するが、ほとんどの教授は「採用」という表現に注意を促す。対立仮説を採用するとは、実際に対立仮説を真と受け入れるというよりは、帰無仮説を棄却したということであり、帰無仮説を真と受け入れるということも、帰無仮説を棄却できないということであって、積極的に「採用」するという表現は避ける方が良い。
帰無仮説と対立仮説を定義する際に、補足的という表現を使ったが、これも$H_{0}$と$H_{1}$が必ずしも論理的否定ではないことを強調する表現である。仮説検定で帰無仮説が真ではないということは、必ずしも対立仮説が真であるという結論にはつながらない。もっと実践的に説明すると、帰無仮説と共存できなければ対立仮説が十分である。例えば、 $$ H_{0} : \theta = 0 \\ H_{1} : \theta < 0 $$ のような仮説検定は全く問題ないが、 $$ H_{0} : \theta \in [-1,0] \\ H_{1} : \theta \in [0,+1] $$ のような場合は$\theta = 0$の時、帰無仮説と対立仮説が両方真である可能性があるため、問題がある。
棄却域
定義によれば、棄却域は事象である。仮説検定を一回の試行と見なすならば、$H_{0}$が棄却される確率は、棄却という事象が発生する確率と同じである。この確率がかなり低く、例えば$\alpha = 0.05$よりも低いにもかかわらず、発生した場合、それは普通の出来事ではなく、注目すべき事象と見なすことができる。こうしたストーリーテリングから、有意水準(p-value)のような概念が自然に思い浮かぶかもしれない。
参照
- 仮説検定の簡単な定義: 厳密さよりも、適度に受け入れやすい定義を紹介する。
- 帰無仮説と対立仮説の決定方法: その定義にどんな問題があるか説明する。
- 仮説検定の厳しい定義: 比較的厳密な数理統計的な仮説検定の定義を紹介する。
- 棄却域の簡単な定義
Casella. (2001)『Statistical Inference』(第2版): p373~374. ↩︎