logo

信頼区間の簡単な定義 📂数理統計学

信頼区間の簡単な定義

定義 1

確率密度関数 f(x;θ)f (x; \theta) を持つ確率変数 XXサンプル X1,,XnX_{1} , \cdots , X_{n}信頼係数confidence Coefficient α(0,1)\alpha \in (0,1) が与えられているとしよう。 L:=L(X1,,Xn)U:=U(X1,,Xn) L := L \left( X_{1} , \cdots , X_{n} \right) \\ U := U \left( X_{1} , \cdots , X_{n} \right) 統計量 L<UL < U が上述のように定義されているとき、次を満たす区間 (L,U)R(L,U) \subset \mathbb{R}母数 θ\theta に対する (1α)100%( 1 - \alpha)100 \% 信頼区間という。 1α=P[θ(L,U)] 1-\alpha = P \left[ \theta \in \left( L,U \right) \right]

説明

実際、信頼区間はR\mathbb{R} より広い空間で信頼領域として一般化することができ、基礎統計学を学ぶ立場からは、上記のように数式で定義することは無駄に難しく感じるかもしれない。しかし、今や確率変数、サンプル、統計量の定義が数理的にしっかりしているので、もう少し厳密な議論を進めることができる。

この信頼区間の定義で重要なのは、LLUU が統計量であることだ。信頼区間が区間として与えられているので、空間的な感覚で信頼区間を見ることもできるだろうが、実際には数理統計学以前の統計学で求めていた信頼区間は、その上限UU と下限LL を求めることで見つけられたはずだ。例えばXX標準正規分布 N(0,1)N(0,1) に従っているならば、μ\mu に対する1α1-\alpha 信頼区間は以下のように求められた。 L:=XSnzα/2U:=X+Snzα/2 L := \overline{X} - {{ S } \over { \sqrt{n} }} z_{\alpha/2} \\ U := \overline{X} + {{ S } \over { \sqrt{n} }} z_{\alpha/2} このように、μ\mu に対する区間推定で実際に「動く」もの、つまり区間の両端がL,UL,U であることに注意しよう。一見すると、区間が与えられていてμ\mu がランダムに変化して信頼区間内に入る確率に関心があるように見えるが、わざわざL,UL,U を「統計量」と呼ぶこと自体がそのような誤読を解消するためである。

同時に見る


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p218. ↩︎