logo

ポアソン分布 📂確率分布論

ポアソン分布

定義 1

pmf.gif

λ>0\lambda > 0に基づき、以下の確率質量関数を持つ離散確率分布Poi(λ)\text{Poi} ( \lambda )ポアソン分布poisson distributionという。 p(x)=eλλxx!,x=0,1,2, p(x) = {{ e^{-\lambda} \lambda^{x} } \over { x! }} \qquad , x = 0 , 1 , 2, \cdots

基本性質

モーメント生成関数

  • [1]: m(t)=exp[λ(et1)],tRm(t) = \exp \left[ \lambda \left( e^{t} - 1 \right) \right] \qquad , t \in \mathbb{R}

平均と分散

  • [2]: XPoi(λ)X \sim \text{Poi}(\lambda)ならば E(X)=λVar(X)=λ \begin{align*} E(X) =& \lambda \\ \Var(X) =& \lambda \end{align*}

十分統計量と最尤推定量

  • [3]: ランダムサンプルX:=(X1,,Xn)Poi(p)\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Poi} \left( p \right)が与えられているとする。

λ\lambdaに対する十分統計量TT最尤推定量λ^\hat{\lambda}は以下の通りである。 T=k=1nXkλ^=1nk=1nXk \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{\lambda} =& {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} \end{align*}

定理

二項分布の極限分布としてのポアソン分布の導出

  • [a]: XnB(n,p)X_{n} \sim B(n,p)としよう。

μnp\mu \approx npならば XnDPoi(μ) X_{n} \overset{D}{\to} \text{Poi} (\mu)

ポアソン分布の極限分布としての標準正規分布の導出

  • [b]: XnPoi(n)X_{n} \sim \text{Poi} \left( n \right)でありYn:=Xnnn\displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }}ならば YnDN(0,1) Y_{n} \overset{D}{\to} N(0,1)

解説

命名

ポアソン分布の確率質量関数は初見には複雑に見えるが、実際には私たちに馴染み深い指数関数の級数展開から来ている。 ex=1+x1!+x22!+x33!+ e^{x} = 1 + {{ x } \over { 1 ! }} + {{ x^{2} } \over { 2! }} + {{ x^{3} } \over { 3! }} + \cdots パラメーターx=λx = \lambdaは通常固定されていると仮定されるため、両辺を定数eλe^{\lambda}で割ることにより 1=eλλ00!+eλλ11!+eλλ22!+eλλ33!+ 1 = {{ e^{-\lambda} \lambda^{0} } \over { 0! }} + {{ e^{-\lambda} \lambda^{1} } \over { 1! }} + {{ e^{-\lambda} \lambda^{2} } \over { 2! }} + {{ e^{-\lambda} \lambda^{3} } \over { 3! }} + \cdots 従って、(当たり前だが)ポアソン分布の確率質量関数の合計は11となる。このようにポアソン分布は二項分布幾何分布負の二項分布と異なり、その名称が数式から来ているわけではない。

偉大な物理学者で数学者でもあるポアソンは、1837年に発表した論文刑法と民法判例における判断の確率についての研究recherches sur la probabilite des jugements en matiere criminelle et en matiere civileで、単位時間内に特定の事件が発生する確率が特定の分布に従うと述べた。この分布はポアソンの名を取ってポアソン分布と呼ばれるようになり、今でも多数の確率理論や統計技術にポアソンの名が付いている。

平均と分散が同じ分布

様々な応用に先立ち、ポアソン分布自体も興味深い研究対象である。ポアソン分布の最も注目すべき基本的性質の一つは、平均と分散がパラメータλ\lambdaと等しいことである。

指数分布との関係

一方、ポアソン分布と指数分布は類似した現象に関心を持っているが、前者は単位時間あたりに発生する事象の回数に、後者は事象が発生するまでにかかる時間に関心があるという差がある。これら二つの分布の関係により、いくつかの書籍では両方の分布に同じギリシャ文字λ\lambdaを使用していることもある。特に、ポアソン分布の平均がλ\lambdaであり、指数分布の平均が1λ\displaystyle {{ 1 } \over { \lambda }}であることを考えると、二つの分布の関係をある種の「逆」のように受け取ることができる。

証明

[1]

m(t)=x=0netxp(x)=x=0netxλxeλx!=eλx=0n(etλ)xx!=eλeλet=exp[λ+λet]=exp[λ(et1)] \begin{align*} m(t) =& \sum_{x=0}^{n} e^{tx} p(x) \\ =& \sum_{x=0}^{n} e^{tx} {{ \lambda^{x} e^{-\lambda} } \over { x! }} \\ =& e^{-\lambda} \sum_{x=0}^{n} {{ \left( e^{t}\lambda \right)^{x} } \over { x! }} \\ =& e^{-\lambda} e^{\lambda e^{t}} \\ =& \exp \left[ -\lambda + \lambda e^{t} \right] \\ =& \exp \left[ \lambda ( e^{t} - 1) \right] \end{align*}

[2]

直接導ける。

[3]

直接導ける。

[a]

モーメント生成関数で近似する。

[b]

テイラー展開で項を省略して近似する。

コード

以下は、ポアソン分布の確率質量関数をGIFアニメーションで示すJuliaコードである。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = 0:20
Λ = collect(1:0.1:10); append!(Λ, reverse(Λ))

animation = @animate for λ ∈ Λ
    scatter(x, pdf.(Poisson(λ), x),
     color = :black,
     label = "λ = $(round(λ, digits = 2))", size = (400,300))
    xlims!(0,10); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,Poi}(\lambda)")
end
gif(animation, "pmf.gif")

  1. Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p152. ↩︎