ポアソン分布
📂確率分布論 ポアソン分布 定義
λ > 0 \lambda > 0 λ > 0 に基づき、以下の確率質量関数を持つ離散確率分布 Poi ( λ ) \text{Poi} ( \lambda ) Poi ( λ ) をポアソン分布 poisson distribution という。
p ( x ) = e − λ λ x x ! , x = 0 , 1 , 2 , ⋯
p(x) = {{ e^{-\lambda} \lambda^{x} } \over { x! }} \qquad , x = 0 , 1 , 2, \cdots
p ( x ) = x ! e − λ λ x , x = 0 , 1 , 2 , ⋯
基本性質 モーメント生成関数 [1]: m ( t ) = exp [ λ ( e t − 1 ) ] , t ∈ R m(t) = \exp \left[ \lambda \left( e^{t} - 1 \right) \right] \qquad , t \in \mathbb{R} m ( t ) = exp [ λ ( e t − 1 ) ] , t ∈ R [2]: X ∼ Poi ( λ ) X \sim \text{Poi}(\lambda) X ∼ Poi ( λ ) ならば
E ( X ) = λ Var ( X ) = λ
\begin{align*}
E(X) =& \lambda
\\ \Var(X) =& \lambda
\end{align*}
E ( X ) = Var ( X ) = λ λ [3]: ランダムサンプル X : = ( X 1 , ⋯ , X n ) ∼ Poi ( p ) \mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Poi} \left( p \right) X := ( X 1 , ⋯ , X n ) ∼ Poi ( p ) が与えられているとする。 λ \lambda λ に対する十分統計量 T T T と最尤推定量 λ ^ \hat{\lambda} λ ^ は以下の通りである。
T = ∑ k = 1 n X k λ ^ = 1 n ∑ k = 1 n X k
\begin{align*}
T =& \sum_{k=1}^{n} X_{k}
\\ \hat{\lambda} =& {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k}
\end{align*}
T = λ ^ = k = 1 ∑ n X k n 1 k = 1 ∑ n X k
定理 [a]: X n ∼ B ( n , p ) X_{n} \sim B(n,p) X n ∼ B ( n , p ) としよう。 μ ≈ n p \mu \approx np μ ≈ n p ならば
X n → D Poi ( μ )
X_{n} \overset{D}{\to} \text{Poi} (\mu)
X n → D Poi ( μ )
[b]: X n ∼ Poi ( n ) X_{n} \sim \text{Poi} \left( n \right) X n ∼ Poi ( n ) でありY n : = X n − n n \displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }} Y n := n X n − n ならば
Y n → D N ( 0 , 1 )
Y_{n} \overset{D}{\to} N(0,1)
Y n → D N ( 0 , 1 ) 解説 命名 ポアソン分布の確率質量関数は初見には複雑に見えるが、実際には私たちに馴染み深い指数関数の級数展開 から来ている。
e x = 1 + x 1 ! + x 2 2 ! + x 3 3 ! + ⋯
e^{x} = 1 + {{ x } \over { 1 ! }} + {{ x^{2} } \over { 2! }} + {{ x^{3} } \over { 3! }} + \cdots
e x = 1 + 1 ! x + 2 ! x 2 + 3 ! x 3 + ⋯
パラメーターx = λ x = \lambda x = λ は通常固定されていると仮定されるため、両辺を定数e λ e^{\lambda} e λ で割ることにより
1 = e − λ λ 0 0 ! + e − λ λ 1 1 ! + e − λ λ 2 2 ! + e − λ λ 3 3 ! + ⋯
1 = {{ e^{-\lambda} \lambda^{0} } \over { 0! }} + {{ e^{-\lambda} \lambda^{1} } \over { 1! }} + {{ e^{-\lambda} \lambda^{2} } \over { 2! }} + {{ e^{-\lambda} \lambda^{3} } \over { 3! }} + \cdots
1 = 0 ! e − λ λ 0 + 1 ! e − λ λ 1 + 2 ! e − λ λ 2 + 3 ! e − λ λ 3 + ⋯
従って、(当たり前だが)ポアソン分布の確率質量関数の合計は1 1 1 となる。このようにポアソン分布は二項分布 、幾何分布 、負の二項分布 と異なり、その名称が数式から来ているわけではない。
偉大な物理学者で数学者でもあるポアソン は、1837年に発表した論文刑法と民法判例における判断の確率についての研究 recherches sur la probabilite des jugements en matiere criminelle et en matiere civile で、単位時間内に特定の事件が発生する確率が特定の分布に従うと述べた。この分布はポアソンの名を取ってポアソン分布と呼ばれるようになり、今でも多数の確率理論や統計技術にポアソンの名が付いている。
平均と分散が同じ分布 様々な応用に先立ち、ポアソン分布自体も興味深い研究対象である。ポアソン分布の最も注目すべき基本的性質の一つは、平均と分散がパラメータλ \lambda λ と等しいことである。
指数分布との関係 一方、ポアソン分布と指数分布は類似した現象に関心を持っているが、前者は単位時間あたりに発生する事象の回数に、後者は事象が発生するまでにかかる時間に関心があるという差がある。これら二つの分布の関係 により、いくつかの書籍では両方の分布に同じギリシャ文字λ \lambda λ を使用していることもある。特に、ポアソン分布の平均がλ \lambda λ であり、指数分布の平均が1 λ \displaystyle {{ 1 } \over { \lambda }} λ 1 であることを考えると、二つの分布の関係をある種の「逆」のように受け取ることができる。
証明 [1] m ( t ) = ∑ x = 0 n e t x p ( x ) = ∑ x = 0 n e t x λ x e − λ x ! = e − λ ∑ x = 0 n ( e t λ ) x x ! = e − λ e λ e t = exp [ − λ + λ e t ] = exp [ λ ( e t − 1 ) ]
\begin{align*}
m(t) =& \sum_{x=0}^{n} e^{tx} p(x)
\\ =& \sum_{x=0}^{n} e^{tx} {{ \lambda^{x} e^{-\lambda} } \over { x! }}
\\ =& e^{-\lambda} \sum_{x=0}^{n} {{ \left( e^{t}\lambda \right)^{x} } \over { x! }}
\\ =& e^{-\lambda} e^{\lambda e^{t}}
\\ =& \exp \left[ -\lambda + \lambda e^{t} \right]
\\ =& \exp \left[ \lambda ( e^{t} - 1) \right]
\end{align*}
m ( t ) = = = = = = x = 0 ∑ n e t x p ( x ) x = 0 ∑ n e t x x ! λ x e − λ e − λ x = 0 ∑ n x ! ( e t λ ) x e − λ e λ e t exp [ − λ + λ e t ] exp [ λ ( e t − 1 ) ]
■
[2] 直接導ける。
■
[3] 直接導ける。
■
[a] モーメント生成関数で近似する。
■
[b] テイラー展開で項を省略して近似する。
■
コード 以下は、ポアソン分布の確率質量関数をGIFアニメーションで示すJulia コードである。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__ )
x = 0 :20
Λ = collect(1 :0.1 :10 ); append!(Λ, reverse(Λ))
animation = @animate for λ ∈ Λ
scatter(x, pdf.(Poisson(λ), x),
color = :black,
label = "λ = $(round(λ, digits = 2 ) )" , size = (400 ,300 ))
xlims!(0 ,10 ); ylims!(0 ,0.5 ); title!(L"\mathrm{pmf\,of\,Poi}(\lambda)" )
end
gif(animation, "pmf.gif" )