최고사후밀도 신용구간

최고사후밀도 신용구간

Highst posterior density credible interval

정의 1

모수공간 $\Theta$ 의 부분집합 $C \subset \Theta$ 가 유의수준 $\alpha$ 에 대해 $C : = \left\{ \theta \in \Theta \ | \ p ( \theta | y ) \ge k (\alpha) \right\}$ 를 자료 $y$ 가 주어졌을 때 $\theta$ 에 대한 $100(1 - \alpha) % $ 최고사후밀도 신용구간HPD이라고 한다.


  • 여기서 $k(\alpha)$ 는 $p(\theta \in C | y ) \ge 1 - \alpha$ 를 만족하는 가장 큰 상수다.

설명

수식과 말보다는 그림을 통해 보는게 훨씬 이해하기 좋다.

20181111\_123324.png

실제 계산에서도 위와 같이 $k$ 를 계속 바꿔가며 적분값이 $1 - \alpha$ 에 근사하도록 찾는 수치적인 방법을 사용한다.

  • 첫번째는 너무 좁게 잡아서 신용구간 자체가 되지 못한다.
  • 두번째는 보수적으로 넓은 구간을 택해서 신용구간은 되지만 범위가 너무 넓어서 쓸모가 없다.
  • 세번째 녹색 부분의 넓이가 $1 - \alpha$ 라면 이때 구해진 구간을 HPD(최고사후밀도) 신용구간이라고 한다.

이러한 구간들이 신용구간이 된다는 설명은 표본평균과 표준오차에 의존하곤 했던 신뢰구간에 비해 훨씬 직관적이다.

등꼬리 신용구간

한편 이러한 HPD 신용구간은 실제 계산이 무척 어려워서 등꼬리 신용구간Equal Tail Credible Interval이라는 것도 사용된다. 등꼬리 신용구간은 그 이름에서 알 수 있듯 $$ \int_{-\infty}^{ a } p(\theta | y) d \theta = \int_{b}^{ \infty } p(\theta | y) d \theta = {{ \alpha } \over {2}} $$ 가 되도록하는 $[a,b]$ 를 말한다.


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p152. ↩︎

댓글