logo

라플라스 사전분포 📂수리통계학

라플라스 사전분포

빌드업

모수에 대한 정보가 거의 없다면 구태여 복잡한 사전분포를 생각할 이유는 없다:

  • 예시1: 내년 모 대학의 통계학과 신입생의 성비를 추측해보라고 했을 때, 통계학과를 어느정도 아는 사람이라면 예년의 성비를 보고 어느정도 짐작을 할 수 있다. 그러나 전혀 관계도 없고 관심도 없는 사람이 이 질문을 들었을 땐, 특별한 이유가 없는 한 50:50이라고 추측할 것이다.
  • 예시2: 어떤 주머니 안에 빨강, 파랑, 초록, 노랑색 구슬이 있다고만 할 때, 그 외에 아무 정보가 없다면 구슬 하나를 뽑았을 때 각 색깔의 구슬이 나올 확률은 그냥 25:25:25:25이라고 추측할 것이다.

정의 1

이렇듯 극도로 정보가 부족한 상황에서 사용하는 사전분포를 무정보적 사전분포noniniformative prior라고 한다. 그 중에서도 특히 어떤 분포를 따른다고 상정하지 않고 일단은 공평하게 모든 가능성을 열어둔 사전분포를 라플라스 사전분포laplace prior라고 한다.

설명

부적절 사전분포

만약 모수 θ\theta 가 어떤 구간 (a,b)(a,b) 에 속한다면 그 사전분포는 π(θ)=1ba,a<θ<b\displaystyle \pi (\theta) = {{1} \over {b-a}} , a < \theta < b 과 같이 일양 분포로 나타날 것이다. 문제는 θ -\infty \le \theta \le \infty 와 같이 모수가 바운드 되어있지 않은 경우다. 이 경우 π(θ)\pi (\theta) 일양 분포로 두면 π(θ)dθ=\displaystyle \int_{-\infty}^{\infty} \pi ( \theta ) d \theta = \infty 과 같이 계산되므로 분포함수로써 쓸 게 못 된다. 이런 경우의 사전분포를 부적절 사전분포improper prior라 부른다. 이러한 부적절 사전분포는 부적절 사후분포를 초래할 수 있으므로 라플라스 사전분포를 사용할 땐 세심한 주의가 필요하다.

부적절 사전분포의 문제점

예를 들어 자료가 지수분포 exp(1θ)\displaystyle \exp \left( {{1} \over {\theta}} \right) 를 따른다고 할 때, 라플라스 사전분포로써 π(θ)c\displaystyle \pi ( \theta ) \propto c 를 생각해볼 수 있다.

이 경우 θ\theta 의 사후분포는 p(θy)1θexp(yθ) p ( \theta | y ) \propto {{1} \over {\theta }} \exp \left( - {{y} \over {\theta }} \right) 다. 이 사후분포가 적절한지 확인하기 위해 θ=1z\displaystyle \theta = {{1} \over {z}} 라 두고 정적분을 구해보면 0p(θy)dθ0zexp(yz)1z2dz= \int_{0 }^{\infty} p ( \theta | y ) d \theta \propto \int_{0}^{\infty} z \exp ( - y z ) {{1} \over {z^2}} dz = \infty 따라서 사후분포는 확률분포함수로써 적절치 않으므로, 다른 사전분포를 고려해봐야한다.

언제나 부적절 사전분포가 문제가 되지는 않는다

그렇지만 부적절 사전분포가 반드시 부적절 사후분포를 이끄는 것은 아니다. 예를 들어 자료가 정규분포 N(θ,σ2)N ( \theta , \sigma^2 ) 를 따른다고 하면, 라플라스 사전분포로써 π(θ)c\displaystyle \pi ( \theta ) \propto c 를 생각해볼 수 있다. 이 경우 θ\theta 의 사후분포는 p(θy1,yn)exp(12σ2i=1n(yiθ)2) p ( \theta | y_{1} , \cdots y_{n} ) \propto \exp \left( - {{1} \over {2 \sigma^2}} \sum_{i=1}^{n} (y_{i} - \theta )^2 \right) 약간 더 계산하면 p(θy1,yn)exp(n2σ2(θy)2) p ( \theta | y_{1} , \cdots y_{n} ) \propto \exp \left( - {{n} \over {2 \sigma^2}} (\theta - \overline{y} )^2 \right) 이므로, 적절한 사후분포 N(y,σ2/n)N ( \overline{y} , \sigma^2 / n ) 을 얻을 수 있다.


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p114. ↩︎