라플라스 사전분포
📂수리통계학라플라스 사전분포
빌드업
모수에 대한 정보가 거의 없다면 구태여 복잡한 사전분포를 생각할 이유는 없다:
- 예시1: 내년 모 대학의 통계학과 신입생의 성비를 추측해보라고 했을 때, 통계학과를 어느정도 아는 사람이라면 예년의 성비를 보고 어느정도 짐작을 할 수 있다. 그러나 전혀 관계도 없고 관심도 없는 사람이 이 질문을 들었을 땐, 특별한 이유가 없는 한 50:50이라고 추측할 것이다.
- 예시2: 어떤 주머니 안에 빨강, 파랑, 초록, 노랑색 구슬이 있다고만 할 때, 그 외에 아무 정보가 없다면 구슬 하나를 뽑았을 때 각 색깔의 구슬이 나올 확률은 그냥 25:25:25:25이라고 추측할 것이다.
정의
이렇듯 극도로 정보가 부족한 상황에서 사용하는 사전분포를 무정보적 사전분포noniniformative prior라고 한다. 그 중에서도 특히 어떤 분포를 따른다고 상정하지 않고 일단은 공평하게 모든 가능성을 열어둔 사전분포를 라플라스 사전분포laplace prior라고 한다.
설명
부적절 사전분포
만약 모수 θ 가 어떤 구간 (a,b) 에 속한다면 그 사전분포는 π(θ)=b−a1,a<θ<b 과 같이 일양 분포로 나타날 것이다. 문제는 −∞≤θ≤∞ 와 같이 모수가 바운드 되어있지 않은 경우다. 이 경우 π(θ) 를 일양 분포로 두면 ∫−∞∞π(θ)dθ=∞ 과 같이 계산되므로 분포함수로써 쓸 게 못 된다. 이런 경우의 사전분포를 부적절 사전분포improper prior라 부른다. 이러한 부적절 사전분포는 부적절 사후분포를 초래할 수 있으므로 라플라스 사전분포를 사용할 땐 세심한 주의가 필요하다.
부적절 사전분포의 문제점
예를 들어 자료가 지수분포 exp(θ1) 를 따른다고 할 때, 라플라스 사전분포로써 π(θ)∝c 를 생각해볼 수 있다.
이 경우 θ 의 사후분포는
p(θ∣y)∝θ1exp(−θy)
다. 이 사후분포가 적절한지 확인하기 위해 θ=z1 라 두고 정적분을 구해보면
∫0∞p(θ∣y)dθ∝∫0∞zexp(−yz)z21dz=∞
따라서 사후분포는 확률분포함수로써 적절치 않으므로, 다른 사전분포를 고려해봐야한다.
언제나 부적절 사전분포가 문제가 되지는 않는다
그렇지만 부적절 사전분포가 반드시 부적절 사후분포를 이끄는 것은 아니다. 예를 들어 자료가 정규분포 N(θ,σ2) 를 따른다고 하면, 라플라스 사전분포로써 π(θ)∝c 를 생각해볼 수 있다. 이 경우 θ 의 사후분포는
p(θ∣y1,⋯yn)∝exp(−2σ21i=1∑n(yi−θ)2)
약간 더 계산하면
p(θ∣y1,⋯yn)∝exp(−2σ2n(θ−y)2)
이므로, 적절한 사후분포 N(y,σ2/n) 을 얻을 수 있다.