帰無仮説と対立仮説の設定方法
説明
仮説検定: 帰無仮説 $H_{0}$ vs 対立仮説 $H_{1}$
2018年4月基準で、一部教科書やウィキペディアでは、帰無仮説を「統計学で初めから捨てることを予想する仮説」とし、対立仮説を「研究を通じて証明されることを期待または予想する仮説」と説明しているが、統計学をすぐに必要な部分だけ勉強したり、軽く知っている程度ならまだしも、深く入っていくと、このような定義に無条件で同意するのが難しくなる。
非科学的な表現:期待と予想
実際の科学の文脈では、説明の必要もなく、明確な例がたくさんあるから、もっと現実社会に近い所で考えてみよう。この段落だけで対立仮説を「研究を通じて証明されることを期待または予想する仮説」ではなく、「裁判を通じて証明されることを期待または予想する仮説」と受け取ろう。
アリスaliceがボブbobを訴えたと思ってみよう。ボブが有罪であることを証明するためには、無罪推定の原則に従って、かなり確実な証拠が必要だ。裁判では、実際に犯罪があるかないかよりも、犯罪事実を証明できるかどうかが重要であり、この時、帰無仮説 $H_{0}$ は「ボブに罪はない」になり、$H_{1}$ は「ボブに罪がある」となる。しかし、このような裁判で帰無仮説が「初めから捨てることを予想する仮説」とするのはおかしい。ボブの犯罪事実を証明したい人がアリスなので、そのように帰無仮説と対立仮説を設定しても良いと言えるわけではない。弁護士も、裁判官も、陪審員も、全員が同じ帰無仮説と対立仮説の下で裁判に臨むからだ。ボブの弁護士は、この裁判で「ボブに罪がない」を対立仮説として設定するだろうか?そうではない。
納得できなければ、ボブがアリスを虚偽告訴罪で反訴したと考えてみよう。通常、どちらか一方は必ず有罪であり、この時ボブが証明したいのはアリスが虚偽告訴罪を犯した事実だ。裁判を個別に見れば問題ないと言えるかもしれないが、結局最初にアリスが訴えを決意したその事件に焦点を当てると、「捨てるもの」や「証明したいもの」によって帰無仮説を定める説明は適切ではない。
研究者の意図
もちろん、これは法律の話であり、‘統計学’や’研究’では異なると言えるかもしれない。しかし、統計学や研究においても、帰無仮説が証明したい仮説である例はいくらでもある。ロジスティック回帰分析ではモデルを選択する際、通常そのモデルが適合していることが期待され、実際の適合度検定では、モデルが適切に適合していることが帰無仮説である。現実にユニコーンが存在しないことを明らかにする研究でも、帰無仮説は「ユニコーンは存在する」だろうか?そうではないだろう。
要点は、裁判でも研究でも、誰かの‘意図’に従って帰無仮説と対立仮説を定めるわけではないということだ。ボブが無罪であるとかボブは有罪ではないとか、正と否定が入れ替わっただけで意味は異ならない。(法的な解釈の細かい違いは置いておこう。)回帰分析を最初に接するときに、このような「否定」を区別するのが難しいために混乱する。
この時、英語と私たちの言語での肯定と否定の違いを考えてみると役立つ。例えば、ボブがあるゲームをしたくないとしよう:
- アリスが私たちの言語で「ゲームしたい?」と聞けば、ボブは「いや、したくない」と答えるだろう。逆に「ゲームしたくない?」と聞けば、ボブは「うん、したくない」と答えるだろう。
- 一方、アリスが英語で “Do you wanna play this game?” と聞けば、ボブは “No, I don’t.” と答えるだろう。逆に “Don’t you wanna play this game?” と聞いても、ボブは依然として “No, I don’t.” と答えるだろう。
比喩するなら、仮説検定は英語での質疑応答のように、質問が肯定形であろうと否定形であろうと、一貫した答えが返ってくるように設定されるべきだ。ある分布を使って仮説検定を実施する場合、その仮説検定は研究者の意図に関係なく、その分布の特性によって変わる。
一緒に見る
- 仮説検定の簡単な定義: 厳密さよりは比較的受け入れやすい定義を紹介する。
- 帰無仮説と対立仮説の定め方: その定義にどんな問題があるか説明する。
- 仮説検定の難しい定義: 比較的厳密な数理統計的な定義を仮説検定に関して紹介する。