数理統計的な信頼集合の定義
定義 1
- パラメータ $\theta$ の区間推定値 $\left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right]$ において、以下をカバレッジ確率coverage Probabilityと呼ぶ。 $$ P_{\theta} \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] \right) = P \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] | \theta \right) $$
- カバレッジ確率の下限を信頼係数confidence Coefficientと呼ぶ。 $$ \inf_{\theta} P_{\theta} \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] \right) $$
説明
信頼区間
信頼係数は信頼水準confidence levelと同じ言葉で、区間推定値と信頼水準が共に現れた時、その区間を信頼区間confidence Intervalと呼ぶ。
まったく無駄な話をすべて省いて、数学的な表現のみで言えば、区間推定値の定義から、区間推定値は統計量によって作られたランダムインターバルであるとした。このシンプルな統計学的定義を見れば、信頼区間が何かをようやく感じることができるだろう。文化統計学の説明とベイジアンの信頼区間の違いを説明する時、もし$N$個の信頼区間を作ればなんとかこんな感じでパラメータの分布がなくてなんとかこんな感じで説明されたものが以下の表現に要約される。 $$ P \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] | \theta \right) $$ 動くもの、変わるもの、ランダムなものはいつも信頼区間それ自体だった、$\theta$ではなかった。式で見るように、$\theta$は定数で、与えられて静止しているもので、それの上下が動くのだ。我々は$\theta$の分布を知らないし、そもそも定数だから知る必要もない。
どうしてこんがらがったのか
このように考えられなかったのは、ほとんどの人が信頼区間を具体的に数字で書かれたものを見てきたからだ。例えば、平均が$3.14$で、信頼水準$95 \%$で信頼区間が$[3.00, 3.28]$だとしよう。
- 初めてこれを見て信頼区間が動くと思う人はいないだろう。普通の人の直感は「ああ、つまり$3.14$という値が$[3.00, 3.28]$の中にある確率が$95\%$なんだね?でも、$5\%$の確率で外に出ることもあるのか?だからこれを信じても完全には信じず、95%ぐらいで信じよう」と考えるのが自然だ。
- $3.14$が$3.30$になって外れることを想像するよりも、信頼区間が$[2.00, 2.28]$として抽出されて$3.14$をカバーできないように外れるとは思えない。$3.00 = L \left( \mathbf{x} \right)$で、$3.28 = U \left( \mathbf{x} \right)$だ。
信頼集合への一般化
カバレッジ確率を通じて信頼区間を定義するにあたり、区間推定値の性質は全く必要なかった。例えば、トポロジー的な連結性などの仮定は必要なかったが、これにより区間を超えて集合それ自体に一般化したものを信頼集合confidence setと呼ぶ。信頼集合は当然ながらパラメータ空間$\Theta$の部分集合であり、サンプル $\mathbf{X}$に依存したランダム集合random set $C \left( \mathbf{X} \right)$として表される。
参照
Casella. (2001). Statistical Inference(2nd Edition): p418. ↩︎