지수 분포와 푸아송 분포의 관계
📂확률분포론지수 분포와 푸아송 분포의 관계
정리
사건이 일어날 때 걸리는 시간 Xk 에 대해 Xk∼exp(λ) 이면 단위시간 당 발생하는 사건의 횟수 N 에 대해 N∼Poi(λ)
설명
지수 분포와 푸아송 분포의 직관적인 정의를 생각해보자. 지수분포는 어떤 사건이 발생하기까지 걸리는 시간에 관심이 있고, 푸아송분포는 단위 시간 내에 어떤 사건이 몇 번 발생하는지 관심이 있다. 어떤 사건이 일어나는 시간과 사건이 일어나는 횟수에 대해, 두 분포는 한 쪽을 고정시키고 다른 한 쪽에 관심을 가지는 것이다. 가령 exp(λ) 와 Poi(λ) 의 모수를 λ=1 이라고 생각해보자. 지수분포를 봤을 땐 사건이 일어날 때까지 단위시간이 걸리는 것이고 포아송분포를 봤을 땐 단위시간당 사건이 한 번 일어난다고 볼 수 있다.
여기서 푸아송 분포의 λ 가 커진다면 단위시간 당 사건의 발생 횟수가 커지는 것이고 그만큼 사건 한 번이 일어나는 시간은 짧아질 것이다. 이런 의미에서, 지수 분포의 평균 λ1 와 푸아송 분포의 평균 λ 는 모수를 표기하는 기호 λ 를 공유하는 것이 타당하다고 볼 수 있겠다. 많은 교재에서 둘의 모수를 하필 λ 로 표기하는데 그 이유를 이렇게 생각해보면 받아들이기 쉬울 것이다.
수식적으로는 감마분포와 지수분포가 관계를 가지고 있고 감마분포가 푸아송분포의 관계를 가지고 있으므로 지수분포와 푸아송분포도 어떠한 관계가 있음을 어렵지 않게 짐작할 수 있을 것이다.
증명
감마분포와 지수분포의 관계에 따라
Xi∼exp(λ)⟺Xi∼Γ(1,λ1)
감마분포를 따르는 k개의 확률변수들을 모두 더하면
Yk=i=1∑kXi∼Γ(n,λ1)
지수분포는 무기억성을 가지고 있으므로 Yi 와 Yj 는 독립이고 Yk 는 단순히 k 번째 사건이 일어난 시각을 나타냄을 알 수 있다. 한편 Yk 의 누적확률분포함수를 Fk 라고 하면
Fk(1)=1−∫1∞Γ(k)λk11xk−1e−λxdx
정리하면
Fk(1)=1−∫1∞Γ(k)λkxk−1e−λxdx
λx=z 으로 치환하면 λdx=dz 이므로
Fk(1)=1−∫λ∞Γ(k)zk−1e−zdz
감마분포와 푸아송 분포의 관계에 따라
Fk(1)=1−∫λ∞Γ(k)zk−1e−zdz=1−y=0∑k−1y!λye−λ
Yk 는 k 번째 사건이 일어난 시각이므로 단위 시간 1동안 사건이 정확히 n 번 일어날 확률은 Yn 이 1보다 작거나 같고 Yn+1 이 1 보다 클 확률과 같다.
P(N=n)=========P(Yn≤1∧Yn+1>1)P(Yn≤1)P(Yn+1>1)P(Yn≤1)(1−P(Yn+1≤1))P(Yn≤1)−P(Yn≤1)P(Yn+1≤1)P(Yn≤1)−P(Yn≤1∧Yn+1≤1)P(Yn≤1)−P(Yn+1≤1)Fn(1)−Fn+1(1)(1−y=0∑n−1y!λye−λ)−(1−y=0∑ny!λye−λ)n!λne−λ
이는 모수가 λ 인 푸아송 분포의 확률 질량 함수이므로, N∼Poi(λ)
■
같이보기