ポアソン分布
定義 1
$\lambda > 0$に基づき、以下の確率質量関数を持つ離散確率分布$\text{Poi} ( \lambda )$をポアソン分布poisson distributionという。 $$ p(x) = {{ e^{-\lambda} \lambda^{x} } \over { x! }} \qquad , x = 0 , 1 , 2, \cdots $$
基本性質
モーメント生成関数
- [1]: $$m(t) = \exp \left[ \lambda \left( e^{t} - 1 \right) \right] \qquad , t \in \mathbb{R}$$
平均と分散
- [2]: $X \sim \text{Poi}(\lambda)$ならば $$ \begin{align*} E(X) =& \lambda \\ \operatorname{Var}(X) =& \lambda \end{align*} $$
十分統計量と最尤推定量
- [3]: ランダムサンプル$\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Poi} \left( p \right)$が与えられているとする。
$\lambda$に対する十分統計量$T$と最尤推定量$\hat{\lambda}$は以下の通りである。 $$ \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{\lambda} =& {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} \end{align*} $$
定理
二項分布の極限分布としてのポアソン分布の導出
- [a]: $X_{n} \sim B(n,p)$としよう。
$\mu \approx np$ならば $$ X_{n} \overset{D}{\to} \text{Poi} (\mu) $$
ポアソン分布の極限分布としての標準正規分布の導出
- [b]: $X_{n} \sim \text{Poi} \left( n \right)$であり$\displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }}$ならば $$ Y_{n} \overset{D}{\to} N(0,1) $$
解説
命名
ポアソン分布の確率質量関数は初見には複雑に見えるが、実際には私たちに馴染み深い指数関数の級数展開から来ている。 $$ e^{x} = 1 + {{ x } \over { 1 ! }} + {{ x^{2} } \over { 2! }} + {{ x^{3} } \over { 3! }} + \cdots $$ パラメーター$x = \lambda$は通常固定されていると仮定されるため、両辺を定数$e^{\lambda}$で割ることにより $$ 1 = {{ e^{-\lambda} \lambda^{0} } \over { 0! }} + {{ e^{-\lambda} \lambda^{1} } \over { 1! }} + {{ e^{-\lambda} \lambda^{2} } \over { 2! }} + {{ e^{-\lambda} \lambda^{3} } \over { 3! }} + \cdots $$ 従って、(当たり前だが)ポアソン分布の確率質量関数の合計は$1$となる。このようにポアソン分布は二項分布、幾何分布、負の二項分布と異なり、その名称が数式から来ているわけではない。
偉大な物理学者で数学者でもあるポアソンは、1837年に発表した論文刑法と民法判例における判断の確率についての研究recherches sur la probabilite des jugements en matiere criminelle et en matiere civileで、単位時間内に特定の事件が発生する確率が特定の分布に従うと述べた。この分布はポアソンの名を取ってポアソン分布と呼ばれるようになり、今でも多数の確率理論や統計技術にポアソンの名が付いている。
平均と分散が同じ分布
様々な応用に先立ち、ポアソン分布自体も興味深い研究対象である。ポアソン分布の最も注目すべき基本的性質の一つは、平均と分散がパラメータ$\lambda$と等しいことである。
指数分布との関係
一方、ポアソン分布と指数分布は類似した現象に関心を持っているが、前者は単位時間あたりに発生する事象の回数に、後者は事象が発生するまでにかかる時間に関心があるという差がある。これら二つの分布の関係により、いくつかの書籍では両方の分布に同じギリシャ文字$\lambda$を使用していることもある。特に、ポアソン分布の平均が$\lambda$であり、指数分布の平均が$\displaystyle {{ 1 } \over { \lambda }}$であることを考えると、二つの分布の関係をある種の「逆」のように受け取ることができる。
証明
[1]
$$ \begin{align*} m(t) =& \sum_{x=0}^{n} e^{tx} p(x) \\ =& \sum_{x=0}^{n} e^{tx} {{ \lambda^{x} e^{-\lambda} } \over { x! }} \\ =& e^{-\lambda} \sum_{x=0}^{n} {{ \left( e^{t}\lambda \right)^{x} } \over { x! }} \\ =& e^{-\lambda} e^{\lambda e^{t}} \\ =& \exp \left[ -\lambda + \lambda e^{t} \right] \\ =& \exp \left[ \lambda ( e^{t} - 1) \right] \end{align*} $$
■
[2]
■
[3]
■
[a]
■
[b]
■
コード
以下は、ポアソン分布の確率質量関数をGIFアニメーションで示すJuliaコードである。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = 0:20
Λ = collect(1:0.1:10); append!(Λ, reverse(Λ))
animation = @animate for λ ∈ Λ
scatter(x, pdf.(Poisson(λ), x),
color = :black,
label = "λ = $(round(λ, digits = 2))", size = (400,300))
xlims!(0,10); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,Poi}(\lambda)")
end
gif(animation, "pmf.gif")
Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p152. ↩︎