負の二項分布
📂確率分布論負の二項分布
定義

r∈N と p∈(0,1] に基づいて、次の確率質量関数を持つ離散確率分布 NB(r,p) を負の二項分布negative Binomial distributionっていう。
p(x)=(x−1r+x−1)pr(1−p)x,x=0,1,2,⋯
基本的な性質
モーメント生成関数
- [1]: m(t)=[1−(1−p)etp]r,t<−log(1−P)
平均と分散
- [2]: X∼NB(r,p) の場合
E(X)=Var(X)=pr(1−p)p2r(1−p)
説明
負の二項分布は、確率 p のある事象が r 回発生するまでの試行回数に関心がある。例えば、コインを投げて表が2回出るまでに何回投げなければならないかを考えてみよう。表が出る確率が 50 なので、表が1回出るには2回投げればいいし、それがもう1回繰り返されなければならないので、その期待値は 4 だと推測できる。
直感的に、負の二項分布は試行回数 r を一般化した幾何分布だと見ることができる。実際、事象が発生する回数が1回、つまり r=1 の場合は、正確に幾何分布と同じになる。
命名の理由
確率質量関数の形が負の二項係数と関連があるため、負の二項分布と呼ばれる。
定理
- [b]: Y=X1+⋯+Xr で、Xi∼iidGeo(p) の場合、Y∼NB(r,p)
証明
[1]
負の二項係数:
(−1)k(k−r)=(kr+k−1)
m(t)====x=0∑∞etxp(x)x=0∑∞etx(xr+x−1)pr(1−p)xprx=0∑∞(x−r)(−1)x[(1−p)et]xprx=0∑∞(x−r)[−(1−p)et]x
二項級数: ∣x∣<1 のとき、α∈C に対して (1+x)α=k=0∑∞(kα)xk
二項級数によると、x=0∑∞(x−r)[−(1−p)et]x=[1−(1−p)et]−r なので
m(t)=[1−(1−p)etp]r,t<−log(1−P)
■
[2]
幾何分布の一般化という点を利用。
■
[b]
幾何分布の確率質量関数が p(x)=p(1−p)x,x=0,1,2,⋯ で定義されるとき、そのモーメント生成関数は以下の通りです。
m(t)=p(1−(1−p)et)−1
互いに独立な確率変数 X1,X2,⋯,Xr が Geo(p) に従うので、Y のモーメント生成関数は
MY(t)=====E(eYt)E(e(X1+X2+⋯+Xr)t)E(eX1t)E(eX2t)⋯E(eXrt)i=1∏rp(1−(1−p)et)−1pr{(1−(1−p)et)}−r
これは負の二項分布 NB(r,p) のモーメント生成関数と同じなので、Y∼NB(r,p)
■
コード
以下は、負の二項分布の確率質量関数をGIFで示すJuliaのコードです。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = 0:20
P = collect(0.2:0.01:0.8); append!(P, reverse(P))
animation = @animate for p ∈ P
scatter(x, pdf.(NegativeBinomial(5, p), x),
color = :black, markerstrokecolor = :black,
label = "r = 5, p = $(rpad(p, 4, '0'))", size = (400,300))
xlims!(0,20); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,NB}(5, p)")
end
gif(animation, "pmf5.gif")
animation = @animate for p ∈ P
scatter(x, pdf.(NegativeBinomial(10, p), x),
color = :black, markerstrokecolor = :black,
label = "r = 10, p = $(rpad(p, 4, '0'))", size = (400,300))
xlims!(0,20); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,NB}(10, p)")
end
gif(animation, "pmf10.gif")