logo

최고사후밀도 신용구간 📂수리통계학

최고사후밀도 신용구간

정의 1

모수공간 Θ\Theta 의 부분집합 CΘC \subset \Theta유의수준 α\alpha 에 대해 C:={θΘ  p(θy)k(α)}C : = \left\{ \theta \in \Theta \ | \ p ( \theta | y ) \ge k (\alpha) \right\}자료 yy 가 주어졌을 때 θ\theta 에 대한 100(1α)100(1 - \alpha) % 최고사후밀도 신용구간hPD이라고 한다.


  • 여기서 k(α)k(\alpha)p(θCy)1αp(\theta \in C | y ) \ge 1 - \alpha 를 만족하는 가장 큰 상수다.

설명

수식과 말보다는 그림을 통해 보는게 훨씬 이해하기 좋다.

20181111\_123324.png

실제 계산에서도 위와 같이 kk 를 계속 바꿔가며 적분값이 1α1 - \alpha 에 근사하도록 찾는 수치적인 방법을 사용한다.

  • 첫번째는 너무 좁게 잡아서 신용구간 자체가 되지 못한다.
  • 두번째는 보수적으로 넓은 구간을 택해서 신용구간은 되지만 범위가 너무 넓어서 쓸모가 없다.
  • 세번째 녹색 부분의 넓이가 1α1 - \alpha 라면 이때 구해진 구간을 HPD(최고사후밀도) 신용구간이라고 한다.

이러한 구간들이 신용구간이 된다는 설명은 [표본평균과 표준오차에 의존하곤 했던 신뢰구간에 비해 훨씬 직관적](../752)이다.

등꼬리 신용구간

한편 이러한 HPD 신용구간은 실제 계산이 무척 어려워서 등꼬리 신용구간equal Tail Credible Interval이라는 것도 사용된다. 등꼬리 신용구간은 그 이름에서 알 수 있듯 ap(θy)dθ=bp(θy)dθ=α2 \int_{-\infty}^{ a } p(\theta | y) d \theta = \int_{b}^{ \infty } p(\theta | y) d \theta = {{ \alpha } \over {2}} 가 되도록하는 [a,b][a,b] 를 말한다.


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p152. ↩︎