logo

信用区間と信頼区間の違い 📂数理統計学

信用区間と信頼区間の違い

定理

信用区間と信頼区間の違いは、本質的にベイジアンとフリークエンティストの違いとみなせる。

  • 信頼区間(フリークエンティスト): パラメーターは固定された定数で、信用区間がランダムに求められる。
  • 信用区間(ベイジアン): パラメーターも変数として分布を持ち、信用区間も事後分布で求められる。

信頼区間

古典統計学では、あるパラメーター μ\mu に対する 95%95 \% 信頼区間 [a,b][a , b] の意味は、同じ方法で作られた信頼区間 100100 個があった場合、その中で 9595 個くらいがμ[a,b]\mu \in [a,b]を満たすということだ。式で簡単に表すとp(μ[a,b])=95%p ( \mu \in [a,b] ) = 95 \% だが、常識とは異なり、この解釈は非常に難解だ。同じ式でも、次のように異なるニュアンスで読める。

  1. μ\mu[a,b][a,b]に含まれる確率は95%95 \% だ。(X)
  2. [a,b][a,b]μ\muを含む確率は95%95 \% だ。(O)

もちろん、上記の2文は同じ意味だが、読む人は文字自体ではなく、ニュアンスの違いを感じ取る必要がある。つまり、μ\mu信頼区間 [a,b][a , b]に含まれる確率が95%95 \% ではなく、信頼区間を作る過程において、95%95 \% 信頼区間 [a,b][a , b]の中にμ\muを含む信頼区間が全体で95%95 \% 程度あるということだ。

私たちが知りたいパラメーター μ\mu自体は、分布を知ることのできない定数であり、代わりに信頼区間の上限と下限であるa,ba,bはその分布を知っているため、a<μa < \muであってもμ<b \mu < bである場合を考えることができる。この微妙な違いのために、信頼区間は私たちの直感と完全に一致しない。だから、こうした常識的で簡単な概念を説明するにも、いくつかを作るとそのうちのいくつかは含まれるのかという抽象的な説明が必要になる。

そもそもμ\muを基準にしてみると、μ\muについて定義された分布がないため、p(μ[a,b])p ( \mu \in [a,b] )という表現自体が意味をなさない。だれかがXXの分布も教えずにP(0X2)P \left( 0 \le X \le 2 \right)の値がいくつかと尋ねたら、かなり戸惑うだろうが、信頼区間に対する誤った解釈がまさにこれと同じだ。

フリークエンティストの観点からパラメーター μ\muは変わらない定数として存在し、サンプルによって変わるのは信頼区間そのものだ。まるで現在のサンプルが母集団と似ていると仮定するように、一つの信頼区間を作り、この信頼区間がまだ作られていない残りの信頼区間と似ていると見るわけだ。

信用区間

パラメータ空間 Θ\Theta の部分集合 CΘC \subset \Theta有意水準 α\alpha に対して P(θCy)1αP ( \theta \in C | y ) \ge 1 - \alpha を満たすとき、データyyが与えられた際のθ\thetaに対する100(1α)%100(1 - \alpha) \% 信用区間と呼ばれる。

一方で、信用区間はそもそもθ\thetaに対する確率として定義される。それが可能なのは、パラメーター θ\thetaに対して事後分布p(θy)p ( \theta | y)を適切に仮定するからだ。これは統計学を学ぶ学生が概念的に受け入れてきた信頼/信用区間の定義と直感的に一致する。

ベイジアンはまだ得ていないサンプルなど気にしない。それは事後分布に関する仮定と、これまでに得たサンプルだけを見て出された最善の答えに過ぎない。したがって、100100個の信用区間を作ったなら、そのうち95%95 \% 程度はパラメーター θ\thetaCCに属しているという稚拙な説明は必要ない。