ラプラスの後継法則
📂数理統計学ラプラスの後継法則
定理
二項モデル p(y∣θ)=(yn)θy(1−θ)n−y の事前分布が一様分布 U(0,1) に従い、事後分布がベータ分布 β(y+1,n−y+1) に従うとするとき、p(θ∣y)∼θy(1−θ)n−y としよう。そうすると、これまでに得られたデータ y について、新しい y~ が 1 である確率は
p(y~=1∣y)=n+2y+1
説明
頻度主義者の視点では、y~=1 の確率はサンプルレート ny に近くなるだろう。しかし、基本的に n が大きくなるほど、n+2y+1≃ny なので、サンプルが増えれば増えるほど、頻度主義者であれベイジアンであれ、結局は似たような推定をすることになる。
一方で、試行を一切行っていない状態、つまり n=0 の場合を考えると、p(y~=1∣y)=21 で事前分布である一様分布とよく合っている。これは、我々の推論が θ=21 から始まったことを数式で示しているのも同然だ。
証明
p(y~=1∣y)====∫01p(y~=1∣θ,y)p(θ∣y)dθ∫01p(y~=1∣θ)p(θ∣y)dθ∫01θp(θ∣y)dθE(θ∣y)
θp(θ∣y) はベータ分布 β(y+1,n−y+1) に従うため、
E(θ∣y)=(y+1)+(n−y+1)y+1=n+2y+1
■