logo

푸아송 분포 📂확률분포론

푸아송 분포

정의 1

pmf.gif

$\lambda > 0$ 에 대해 다음과 같은 확률 질량 함수를 가지는 이산 확률 분포 $\text{Poi} ( \lambda )$ 를 푸아송 분포poisson distribution라고 한다. $$ p(x) = {{ e^{-\lambda} \lambda^{x} } \over { x! }} \qquad , x = 0 , 1 , 2, \cdots $$

기초 성질

적률 생성 함수

  • [1]: $$m(t) = \exp \left[ \lambda \left( e^{t} - 1 \right) \right] \qquad , t \in \mathbb{R}$$

평균과 분산

  • [2]: $X \sim \text{Poi}(\lambda)$ 면 $$ \begin{align*} E(X) =& \lambda \\ \operatorname{Var}(X) =& \lambda \end{align*} $$

충분통계량과 최대우도추정량

  • [3]: 랜덤샘플 $\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Poi} \left( p \right)$ 이 주어져 있다고 하자.

$\lambda$ 에 대한 충분통계량 $T$ 와 최대우도추정량 $\hat{\lambda}$ 는 다음과 같다. $$ \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{\lambda} =& {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} \end{align*} $$

정리

이항분포의 극한분포로써 푸아송분포 유도

  • [a]: $X_{n} \sim B(n,p)$이라고 하자.

$\mu \approx np$ 이면 $$ X_{n} \overset{D}{\to} \text{Poi} (\mu) $$

푸아송분포의 극한분포로써 표준정규분포 유도

  • [b]: $X_{n} \sim \text{Poi} \left( n \right)$ 이고 $\displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }}$ 이면 $$ Y_{n} \overset{D}{\to} N(0,1) $$

설명

명명

푸아송 분포의 확률 질량 질량함수는 언뜻 복잡해 보이지만 사실 우리에게 친숙한 지수 함수의 급수 전개에서 나온 것이다. $$ e^{x} = 1 + {{ x } \over { 1 ! }} + {{ x^{2} } \over { 2! }} + {{ x^{3} } \over { 3! }} + \cdots $$ 모수 $x = \lambda$ 는 보통 고정되어있다고 가정되므로 양변을 상수 $e^{\lambda}$ 로 나누면 $$ 1 = {{ e^{-\lambda} \lambda^{0} } \over { 0! }} + {{ e^{-\lambda} \lambda^{1} } \over { 1! }} + {{ e^{-\lambda} \lambda^{2} } \over { 2! }} + {{ e^{-\lambda} \lambda^{3} } \over { 3! }} + \cdots $$ 따라서 (당연하게도) 푸아송 분포의 확률 질량 함수를 모두 더한 값은 $1$ 이 된다. 이렇듯 푸아송 분포는 이항 분포, 기하 분포, 음이항 분포와 달리 수식에서 그 이름을 따온 것이 아니다.

위대한 물리학자이자 수학자인 푸아송은 1837년 발표한 논문 형법과 민법 판결에서 확률에 대한 연구recherches sur la probabilite des jugements en matiere criminelle et en matiere civile에서 단위 시간동안 관심을 갖는 사건이 일어날 확률이 특정한 분포를 따른다고 했다. 그 분포는 푸아송의 이름을 따서 푸아송 분포라 불리게 되었고, 아직도 수많은 확률 이론과 통계 기법에 푸아송의 이름이 붙어 있게 되었다.

평균과 분산이 같은 분포

다양한 응용 이전에 푸아송 분포는 그 자체로도 흥미로운 연구 대상이다. 푸아송 분포의 기본적인 성질 중 가장 눈에 띄는 것은 평균과 분산이 모수 $\lambda$ 라는 것이다.

지수분포와의 관계

한편 푸아송 분포와 지수 분포는 비슷한 현상에 관심을 가지지만 각각 단위 시간동안 사건의 발생 횟수, 사건이 발생때까지 걸리는 시간에 관심이 있다는 차이가 있다. 두 분포의 이러한 관계 때문에 몇몇 책에서 두 분포는 같은 그리스 문자 $\lambda$ 를 쓰기도 한다. 특히 푸아송 분포의 평균이 $\lambda$, 지수 분포의 평균이 $\displaystyle {{ 1 } \over { \lambda }}$ 이라는 점을 생각해보면 두 분포의 관계가 어떤 ‘역’ 비슷한 것이라고 받아들일 수 있다.

증명

[1]

$$ \begin{align*} m(t) =& \sum_{x=0}^{n} e^{tx} p(x) \\ =& \sum_{x=0}^{n} e^{tx} {{ \lambda^{x} e^{-\lambda} } \over { x! }} \\ =& e^{-\lambda} \sum_{x=0}^{n} {{ \left( e^{t}\lambda \right)^{x} } \over { x! }} \\ =& e^{-\lambda} e^{\lambda e^{t}} \\ =& \exp \left[ -\lambda + \lambda e^{t} \right] \\ =& \exp \left[ \lambda ( e^{t} - 1) \right] \end{align*} $$

[2]

직접연역한다.

[3]

직접 연역한다.

[a]

적률생성함수로 근사시킨다.

[b]

테일러 전개로 항을 버려 근사시킨다.

코드

다음은 푸아송분포의 확률질량함수를 움짤로 보여주는 줄리아 코드다.

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = 0:20
Λ = collect(1:0.1:10); append!(Λ, reverse(Λ))

animation = @animate for λ ∈ Λ
    scatter(x, pdf.(Poisson(λ), x),
     color = :black,
     label = "λ = $(round(λ, digits = 2))", size = (400,300))
    xlims!(0,10); ylims!(0,0.5); title!(L"\mathrm{pmf\,of\,Poi}(\lambda)")
end
gif(animation, "pmf.gif")

  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p152. ↩︎