幾何分布
定義 1
$p \in (0,1]$に対して、次のような確率質量関数を持つ離散確率分布 $\text{Geo}(p)$を幾何分布geometric distributionと呼ぶ。 $$ p(x) = p (1 - p)^{x-1} \qquad , x = 1 , 2, 3, \cdots $$
- 二つの定義が使用されているので、公式と定義域に特に注意が必要である。
基本性質
モーメント生成関数
- [1]: $$m(t) = {{ p e^{t} } \over { 1 - (1-p) e^{t} }} \qquad , t < -\log (1-p)$$
平均と分散
- [2]: $X \sim \text{Geo} (p)$なら $$ \begin{align*} E(X) =& {{ 1 } \over { p }} \\ \operatorname{Var}(X) =& {{ 1-p } \over { p^{2} }} \end{align*} $$
十分統計量と最尤推定量
- [3]: ランダムサンプル $\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Geo} \left( p \right)$が与えられたとする。$p$に対する十分統計量 $T$と最尤推定量 $\hat{p}$は以下の通りである。 $$ \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{p} =& {{ n } \over { \sum_{k=1}^{n} X_{k} }} \end{align*} $$
定理
無記憶性
- [a]: $X \sim \text{Geo} (p)$なら $$ P(X \ge s+ t ,|, X \ge s) = P(X \ge t) $$
幾何分布への一般化
- [b]: $Y = X_{1} + \cdots + X_{r}$であり$X_{i} \overset{\text{iid}}{\sim} \text{Geo}(p)$なら$Y \sim \text{NB}(r,p)$
解説
指数分布との関係
幾何分布は、確率$0 < p \le 1$で成功するまでの試行回数に関心を持っている。その確率質量関数は、確率$(1-p)$で$x-1$回失敗した後、最後に確率$p$で成功する確率を表している。この特性により、指数分布の離散化と見ることができる。
名称
確率質量関数が幾何級数の形をしているため、この分布が幾何分布と呼ばれる。$a := p$、$r := (1-p)$と置くと、$p(x) = a r ^{x-1}$の馴染みのある式を得る。実際にモーメント生成関数を求めるときも、幾何級数の公式が登場する。
証明
[1]
$$ \begin{align*} M(t) =& \sum_{x=1}^{\infty} e^{tx} p(x) \\ =& \sum_{x=1}^{\infty} e^{tx} p (1-p)^{x-1} \\ =& p e^{t} \sum_{x=1}^{\infty} \left[ e^{t}(1-p) \right]^{x-1} \end{align*} $$ $ t < -\log (1-p)$のとき、幾何級数の公式により $$ p e^{t} \sum_{x=1}^{\infty} \left[ e^{t}(1-p) \right]^{x-1} = {{ p e^{t} } \over { 1 - (1-p) e^{t} }} $$
■
[2]
■
[3]
■
[a]
■
[b]
■
コード
次は、幾何分布の確率質量関数をGIFで表示するJuliaのコードだ。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = 0:20
P = collect(0.01:0.01:0.5); append!(P, reverse(P))
animation = @animate for p ∈ P
scatter(x, pdf.(Geometric(p), x),
color = :black, markerstrokecolor = :black,
label = "p = $(rpad(p, 4, '0'))", size = (400,300))
xlims!(0,20); ylims!(0,0.3); title!(L"\mathrm{pmf\,of\,Geo}(p)")
end
gif(animation, "pmf.gif")
Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p145. ↩︎