logo

ラプラスの後継法則 📂数理統計学

ラプラスの後継法則

定理 1

二項モデル p(yθ)=(ny)θy(1θ)ny\displaystyle p(y | \theta) = \binom{ n }{ y} \theta^{y} (1- \theta)^{n-y} の事前分布が一様分布 U(0,1)U (0,1) に従い、事後分布がベータ分布 β(y+1,ny+1)\beta (y+1 , n-y+1) に従うとするとき、p(θy)θy(1θ)nyp( \theta | y ) \sim \theta^{y} (1- \theta)^{n-y} としよう。そうすると、これまでに得られたデータ yy について、新しい y~\tilde{y}11 である確率は p(y~=1y)=y+1n+2 p(\tilde{y} = 1| y) = {{y+1} \over {n+2}}

説明

頻度主義者の視点では、y~=1\tilde{y} = 1 の確率はサンプルレート yn\displaystyle {{y} \over {n}} に近くなるだろう。しかし、基本的に nn が大きくなるほど、y+1n+2yn\displaystyle {{y+1} \over {n+2}} \simeq {{y} \over {n}} なので、サンプルが増えれば増えるほど、頻度主義者であれベイジアンであれ、結局は似たような推定をすることになる。 一方で、試行を一切行っていない状態、つまり n=0n=0 の場合を考えると、p(y~=1y)=12\displaystyle p(\tilde{y} = 1| y) = {{1} \over {2}} で事前分布である一様分布とよく合っている。これは、我々の推論が θ=12\displaystyle \theta = {{1} \over {2}} から始まったことを数式で示しているのも同然だ。

証明

p(y~=1y)=01p(y~=1θ,y)p(θy)dθ=01p(y~=1θ)p(θy)dθ=01θp(θy)dθ=E(θy) \begin{align*} p (\tilde{y} = 1| y) =& \int_{0}^{1} p(\tilde{y} = 1| \theta , y) p (\theta | y) d \theta \\ =& \int_{0}^{1} p(\tilde{y} = 1| \theta ) p (\theta | y) d \theta \\ =& \int_{0}^{1} \theta p (\theta | y) d \theta \\ =& E( \theta | y) \end{align*}

θp(θy)\theta p (\theta | y)ベータ分布 β(y+1,ny+1)\beta (y+1 , n-y+1) に従うため、

E(θy)=y+1(y+1)+(ny+1)=y+1n+2 E( \theta | y) = {{y+1} \over {(y+1) + (n-y+1)}} = {{y+1} \over {n+2}}


  1. 김달호. (2013). R과 WinBUGS를 이용한 베이지안 통계학: p95. ↩︎