logo

신용구간 📂수리통계학

신용구간

정의 1

모수공간 Θ\Theta 의 부분집합 CΘC \subset \Theta유의수준 α\alpha 에 대해 P(θCy)1αP ( \theta \in C | y ) \ge 1 - \alpha 를 만족할 때, CC자료 yy 가 주어졌을 때 θ\theta 에 대한 100(1α)100(1 - \alpha) % 신용구간credible Interval이라고 한다.

설명

베이지안에서의 구간추정이란 모수 θ\theta 를 포함하는 확률이 높은 구간을 찾는 것이다. 이로써 찾아지는 ‘신용구간’이란 프리퀀티스트에게는 신뢰구간에 대응되는 개념이다.

수식의 이해

수식이 조금 어렵게 쓰여있긴한데 한번 풀어헤쳐보자. 적분꼴로 나타내보면 P(θCy)=θCp(θy)dθ P ( \theta \in C | y ) = \int_{ \theta \in C} p ( \theta | y) d \theta 이해를 돕기위해 그냥 유의수준을 α=0.05\alpha = 0.05 라고 두면 θCp(θy)dθ0.95 \int_{ \theta \in C} p ( \theta | y) d \theta \ge 0.95 일 때 CC 를 신용구간이라고 한다. 조금만 더 친숙한 표현으로 바꿔 C=[a,b]C = [a,b] 라고 쓰면 abp(θy)dθ0.95 \int_{a}^{b} p ( \theta | y) d \theta \ge 0.95 이다. 아래의 두 그림에서 채색된 부분의 면적이 0.950.95 보다 크거나 같다면, 이 적분구간 CC 는 뭐가 됐든 신용구간이 된다.

그러나 신용구간은 그 길이가 짧을수록 정확하므로 조건을 만족하는 신용구간 중에선 가장 작은게 좋다. 따라서 만약 둘 중에 하나를 골라야한다면 오른쪽이 될 것이고, 실제 추정에선 좀 더 정확한 방법을 사용한다.

20181111\_124207.png

보수적인 정의

신용구간이 정확하게 P(θCy)=1αP ( \theta \in C | y ) = 1 - \alpha 이 아니라 P(θCy)1αP ( \theta \in C | y ) \ge 1 - \alpha 으로 정의된 이유는 그냥 안전을 기하기 위함이다. 계산을 하다보면 꼭 정확하게 맞출수 없을 경우도 있기 때문에, 괜히 구간을 좁혔다가 틀리느니 살짝 넓게 잡는 것이다.

이런 걸 보면 볼수록 프리퀀티스트들의 신뢰구간과 뭐가 다르고 굳이 새롭게 정의할 필요가 있나 싶을 것이다. 하지만 미묘해보이는 이 차이야말로 베이지안을 매력적으로 만드는 핵심 요소중의 하나다.


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p152. ↩︎