신용구간

신용구간

정의 1

모수공간 $\Theta$ 의 부분집합 $C \subset \Theta$ 가 유의수준 $\alpha$ 에 대해 $P ( \theta \in C | y ) \ge 1 - \alpha$ 를 만족할 때, $C$ 를 자료 $y$ 가 주어졌을 때 $\theta$ 에 대한 $100(1 - \alpha) % $ 신용구간Credible Interval이라고 한다.

설명

베이지안에서의 구간추정이란 모수 $\theta$ 를 포함하는 확률이 높은 구간을 찾는 것이다. 이로써 찾아지는 ‘신용구간’이란 프리퀀티스트에게는 신뢰구간에 대응되는 개념이다.

수식의 이해

수식이 조금 어렵게 쓰여있긴한데 한번 풀어헤쳐보자. 적분꼴로 나타내보면 $$ P ( \theta \in C | y ) = \int_{ \theta \in C} p ( \theta | y) d \theta $$ 이해를 돕기위해 그냥 유의수준을 $\alpha = 0.05$ 라고 두면 $$ \int_{ \theta \in C} p ( \theta | y) d \theta \ge 0.95 $$ 일 때 $C$ 를 신용구간이라고 한다. 조금만 더 친숙한 표현으로 바꿔 $C = [a,b] $ 라고 쓰면 $$ \int_{a}^{b} p ( \theta | y) d \theta \ge 0.95 $$ 이다. 아래의 두 그림에서 채색된 부분의 면적이 $0.95$ 보다 크거나 같다면, 이 적분구간 $C$ 는 뭐가 됐든 신용구간이 된다.

그러나 신용구간은 그 길이가 짧을수록 정확하므로 조건을 만족하는 신용구간 중에선 가장 작은게 좋다. 따라서 만약 둘 중에 하나를 골라야한다면 오른쪽이 될 것이고, 실제 추정에선 좀 더 정확한 방법을 사용한다.

20181111\_124207.png

보수적인 정의

신용구간이 정확하게 $P ( \theta \in C | y ) = 1 - \alpha$ 이 아니라 $P ( \theta \in C | y ) \ge 1 - \alpha$ 으로 정의된 이유는 그냥 안전을 기하기 위함이다. 계산을 하다보면 꼭 정확하게 맞출수 없을 경우도 있기 때문에, 괜히 구간을 좁혔다가 틀리느니 살짝 넓게 잡는 것이다.

이런 걸 보면 볼수록 프리퀀티스트들의 신뢰구간과 뭐가 다르고 굳이 새롭게 정의할 필요가 있나 싶을 것이다. 하지만 미묘해보이는 이 차이야말로 베이지안을 매력적으로 만드는 핵심 요소중의 하나다.


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p152. ↩︎

댓글