logo

幾何分布 📂確率分布論

幾何分布

定義 1

pmf.gif

p(0,1]p \in (0,1]に対して、次のような確率質量関数を持つ離散確率分布 Geo(p)\text{Geo}(p)幾何分布geometric distributionと呼ぶ。 p(x)=p(1p)x1,x=1,2,3, p(x) = p (1 - p)^{x-1} \qquad , x = 1 , 2, 3, \cdots


  • 二つの定義が使用されているので、公式と定義域に特に注意が必要である。

基本性質

モーメント生成関数

  • [1]: m(t)=pet1(1p)et,t<log(1p)m(t) = {{ p e^{t} } \over { 1 - (1-p) e^{t} }} \qquad , t < -\log (1-p)

平均と分散

  • [2]: XGeo(p)X \sim \text{Geo} (p)なら E(X)=1pVar(X)=1pp2 \begin{align*} E(X) =& {{ 1 } \over { p }} \\ \Var(X) =& {{ 1-p } \over { p^{2} }} \end{align*}

十分統計量と最尤推定量

  • [3]: ランダムサンプル X:=(X1,,Xn)Geo(p)\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Geo} \left( p \right)が与えられたとする。ppに対する十分統計量 TT最尤推定量 p^\hat{p}は以下の通りである。 T=k=1nXkp^=nk=1nXk \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{p} =& {{ n } \over { \sum_{k=1}^{n} X_{k} }} \end{align*}

定理

無記憶性

  • [a]: XGeo(p)X \sim \text{Geo} (p)なら P(Xs+t,,Xs)=P(Xt) P(X \ge s+ t ,|, X \ge s) = P(X \ge t)

幾何分布への一般化

  • [b]: Y=X1++XrY = X_{1} + \cdots + X_{r}でありXiiidGeo(p)X_{i} \overset{\text{iid}}{\sim} \text{Geo}(p)ならYNB(r,p)Y \sim \text{NB}(r,p)

解説

指数分布との関係

幾何分布は、確率0<p10 < p \le 1で成功するまでの試行回数に関心を持っている。その確率質量関数は、確率(1p)(1-p)x1x-1回失敗した後、最後に確率ppで成功する確率を表している。この特性により、指数分布の離散化と見ることができる。

名称

確率質量関数が幾何級数の形をしているため、この分布が幾何分布と呼ばれる。a:=pa := pr:=(1p)r := (1-p)と置くと、p(x)=arx1p(x) = a r ^{x-1}の馴染みのある式を得る。実際にモーメント生成関数を求めるときも、幾何級数の公式が登場する。

証明

[1]

M(t)=x=1etxp(x)=x=1etxp(1p)x1=petx=1[et(1p)]x1 \begin{align*} M(t) =& \sum_{x=1}^{\infty} e^{tx} p(x) \\ =& \sum_{x=1}^{\infty} e^{tx} p (1-p)^{x-1} \\ =& p e^{t} \sum_{x=1}^{\infty} \left[ e^{t}(1-p) \right]^{x-1} \end{align*} t<log(1p) t < -\log (1-p)のとき、幾何級数の公式により petx=1[et(1p)]x1=pet1(1p)et p e^{t} \sum_{x=1}^{\infty} \left[ e^{t}(1-p) \right]^{x-1} = {{ p e^{t} } \over { 1 - (1-p) e^{t} }}

[2]

二つの方法がある。

[3]

直接演繹する。

[a]

条件付き確率で演繹する。

[b]

モーメント生成関数で演繹する。

コード

次は、幾何分布の確率質量関数をGIFで表示するJuliaのコードだ。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = 0:20
P = collect(0.01:0.01:0.5); append!(P, reverse(P))

animation = @animate for p ∈ P
    scatter(x, pdf.(Geometric(p), x),
     color = :black, markerstrokecolor = :black,
     label = "p = $(rpad(p, 4, '0'))", size = (400,300))
    xlims!(0,20); ylims!(0,0.3); title!(L"\mathrm{pmf\,of\,Geo}(p)")
end
gif(animation, "pmf.gif")

  1. Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p145. ↩︎