logo

信頼区間の簡単な定義 📂数理統計学

信頼区間の簡単な定義

定義 1

確率密度関数 $f (x; \theta)$ を持つ確率変数 $X$ のサンプル $X_{1} , \cdots , X_{n}$ と信頼係数confidence Coefficient $\alpha \in (0,1)$ が与えられているとしよう。 $$ L := L \left( X_{1} , \cdots , X_{n} \right) \\ U := U \left( X_{1} , \cdots , X_{n} \right) $$ 統計量 $L < U$ が上述のように定義されているとき、次を満たす区間 $(L,U) \subset \mathbb{R}$ を母数 $\theta$ に対する $( 1 - \alpha)100 \%$ 信頼区間という。 $$ 1-\alpha = P \left[ \theta \in \left( L,U \right) \right] $$

説明

実際、信頼区間は$\mathbb{R}$ より広い空間で信頼領域として一般化することができ、基礎統計学を学ぶ立場からは、上記のように数式で定義することは無駄に難しく感じるかもしれない。しかし、今や確率変数、サンプル、統計量の定義が数理的にしっかりしているので、もう少し厳密な議論を進めることができる。

この信頼区間の定義で重要なのは、$L$ と$U$ が統計量であることだ。信頼区間が区間として与えられているので、空間的な感覚で信頼区間を見ることもできるだろうが、実際には数理統計学以前の統計学で求めていた信頼区間は、その上限$U$ と下限$L$ を求めることで見つけられたはずだ。例えば$X$ が標準正規分布 $N(0,1)$ に従っているならば、$\mu$ に対する$1-\alpha$ 信頼区間は以下のように求められた。 $$ L := \overline{X} - {{ S } \over { \sqrt{n} }} z_{\alpha/2} \\ U := \overline{X} + {{ S } \over { \sqrt{n} }} z_{\alpha/2} $$ このように、$\mu$ に対する区間推定で実際に「動く」もの、つまり区間の両端が$L,U$ であることに注意しよう。一見すると、区間が与えられていて$\mu$ がランダムに変化して信頼区間内に入る確率に関心があるように見えるが、わざわざ$L,U$ を「統計量」と呼ぶこと自体がそのような誤読を解消するためである。

同時に見る


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p218. ↩︎