라플라스 사전분포

빌드업

모수에 대한 정보가 거의 없다면 구태여 복잡한 사전분포를 생각할 이유는 없다:

예시1: 내년 모 대학의 통계학과 신입생의 성비를 추측해보라고 했을 때, 통계학과를 어느정도 아는 사람이라면 예년의 성비를 보고 어느정도 짐작을 할 수 있다. 그러나 전혀 관계도 없고 관심도 없는 사람이 이 질문을 들었을 땐, 특별한 이유가 없는 한 50:50이라고 추측할 것이다.
예시2: 어떤 주머니 안에 빨강, 파랑, 초록, 노랑색 구슬이 있다고만 할 때, 그 외에 아무 정보가 없다면 구슬 하나를 뽑았을 때 각 색깔의 구슬이 나올 확률은 그냥 25:25:25:25이라고 추측할 것이다.

정의 ¹

이렇듯 극도로 정보가 부족한 상황에서 사용하는 사전분포를 무정보적 사전분포^{noniniformative prior}라고 한다. 그 중에서도 특히 어떤 분포를 따른다고 상정하지 않고 일단은 공평하게 모든 가능성을 열어둔 사전분포를 라플라스 사전분포^{laplace prior}라고 한다.

설명

부적절 사전분포

만약 모수 $\theta$ 가 어떤 구간 $(a,b)$ 에 속한다면 그 사전분포는 $\displaystyle \pi (\theta) = {{1} \over {b-a}} , a < \theta < b$ 과 같이 일양 분포로 나타날 것이다. 문제는 $ -\infty \le \theta \le \infty$ 와 같이 모수가 바운드 되어있지 않은 경우다. 이 경우 $\pi (\theta) $ 를 일양 분포로 두면 $\displaystyle \int_{-\infty}^{\infty} \pi ( \theta ) d \theta = \infty$ 과 같이 계산되므로 분포함수로써 쓸 게 못 된다. 이런 경우의 사전분포를 부적절 사전분포^{improper prior}라 부른다. 이러한 부적절 사전분포는 부적절 사후분포를 초래할 수 있으므로 라플라스 사전분포를 사용할 땐 세심한 주의가 필요하다.

부적절 사전분포의 문제점

예를 들어 자료가 지수분포 $\displaystyle \exp \left( {{1} \over {\theta}} \right)$ 를 따른다고 할 때, 라플라스 사전분포로써 $\displaystyle \pi ( \theta ) \propto c$ 를 생각해볼 수 있다.

이 경우 $\theta$ 의 사후분포는 $$ p ( \theta | y ) \propto {{1} \over {\theta }} \exp \left( - {{y} \over {\theta }} \right) $$ 다. 이 사후분포가 적절한지 확인하기 위해 $\displaystyle \theta = {{1} \over {z}}$ 라 두고 정적분을 구해보면 $$ \int_{0 }^{\infty} p ( \theta | y ) d \theta \propto \int_{0}^{\infty} z \exp ( - y z ) {{1} \over {z^2}} dz = \infty $$ 따라서 사후분포는 확률분포함수로써 적절치 않으므로, 다른 사전분포를 고려해봐야한다.

언제나 부적절 사전분포가 문제가 되지는 않는다

그렇지만 부적절 사전분포가 반드시 부적절 사후분포를 이끄는 것은 아니다. 예를 들어 자료가 정규분포 $N ( \theta , \sigma^2 )$ 를 따른다고 하면, 라플라스 사전분포로써 $\displaystyle \pi ( \theta ) \propto c$ 를 생각해볼 수 있다. 이 경우 $\theta$ 의 사후분포는 $$ p ( \theta | y_{1} , \cdots y_{n} ) \propto \exp \left( - {{1} \over {2 \sigma^2}} \sum_{i=1}^{n} (y_{i} - \theta )^2 \right) $$ 약간 더 계산하면 $$ p ( \theta | y_{1} , \cdots y_{n} ) \propto \exp \left( - {{n} \over {2 \sigma^2}} (\theta - \overline{y} )^2 \right) $$ 이므로, 적절한 사후분포 $N ( \overline{y} , \sigma^2 / n )$ 을 얻을 수 있다.

김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p114. ↩︎