지수분포를 통한 푸아송 프로세스의 정의
정의
- $\tau_{1} , \tau_{2} , \cdots \sim \text{exp} ( \lambda )$ 이라고 하자.
$\lambda$ 를 강도intensity라고 한다. 2. $\displaystyle s_{n}:= \sum_{k=1}^{n} \tau_{k}$ 를 도달 시간arrival Time이라 한다. 3. $N_{t}:= \begin{cases} 0 , & 0 \le t < s_{1} \\ k , & s_{k} \le t < s_{k+1} \end{cases}$ 와 같이 정의된 확률과정 $\left\{ N_{t} \right\}_{t = 0}^{\infty}$ 를 푸아송 프로세스poisson process라 한다.
기초 성질
- [1]: $\displaystyle p (N_{t} = k ) = {{ ( \lambda t )^{t} e^{ - \lambda t} } \over { k! }}$
- [2]: $\displaystyle p \left( ( N_{t} - N_{s} ) = k \right) = {{ ( \lambda (t - s ) )^{t} e^{ - \lambda ( t - s )} } \over { k! }}$
- [3]: $E ( N_{t} - N_{s} ) = \lambda (t - s)$
- [4]: $\operatorname{Var} ( N_{t} - N_{s} ) = \lambda ( t - s)$
설명
$\displaystyle E ( \tau_{i} ) = {{1} \over {\lambda }}$ 이므로, 강도가 높다는 표현은 $\tau_{i}$ 가 짧고 사건이 빈번하게 일어남을 의미한다. 미분소 행렬을 통한 푸아송 프로세스의 정의와 비교해보면 도달시간이 따르는 연속 마코프체인임이 잘 드러나지 않는 대신 지수분포가 바로 보인다.
정의만으로 보았을 땐 이것이 왜 푸아송 프로세스로 불리는지 이해하기 어렵지만, 지수분포와 푸아송분포의 관계를 알고 있다면 어렵지 않게 받아들일 수 있을 것이다. 증명은 본질적으로 같다.
[3]과 [4]의 증명은 푸아송 분포의 평균, 분산과 본질적으로 같다.
예시
푸아송 프로세스는 재고관리나 역학조사 등 폭넓은 분야에서 유용하게 쓰이고 있다. 예시로써 전염병이 창궐하는 상황을 생각해보자.
정부와 관련기관은 한시라도 빨리 이에 대한 대책을 내놓아야하고, 당연히 현재 상황을 파악하는 것이 급선무다. 보통 전염병에는 잠복기라는 것이 있어서 실제로 증상이 나타난 ‘환자’ 외에도 아직 증상이 나타나지 않은 ‘보균자’가 있다. 이 보균자의 수를 제대로 파악하지 못하면 향후 백신 수요를 감당할 수 없게 될 수도 있다.
이제 잠복기 $\tau$ 가 누적밀도함수 $Q ( r ):= p ( \tau \le r )$ 를 갖는 확률변수라고 하고 $N_{1;t}$ 가 현재 환자의 수, $N_{2;t}$ 가 현재 보균자의 수라고 해보자. $N_{1;t}$, $N_{2;t}$ 는 푸아송 프로세스고, 병에 걸린 전체 인원은 여전히 푸아송 프로세스 $N_{t}:= N_{1;t} + N_{2;t}$ 와 같이 나타날 것이다.
푸아송분포의 덧셈: $X_i \sim \text{Poi}( m_{i} )$ 이면 $$\sum_{i=1}^{n} X_{i} \sim \text{Poi} \left( \sum_{i=1}^{n} m_{i} \right)$$
한 개인이 처음 바이러스에 접촉한 시점을 $s$, 현재를 $t$ 라고 한다면 $(t - s) > \tau$ 일 때 증상이 나타날 것이다. $Q ( t - s ) = p ( \tau \le t - s )$ 이므로, 현시점에서 환자 수의 기댓값은 $$ n: = E ( N_{1;t} ) = \lambda \int_{0}^{t} Q (t - s ) ds $$ 이고 보균자 수의 기댓값은 $$ m: = E ( N_{2;t} ) = \lambda \int_{0}^{t} \left[ 1 - Q (t - s ) \right] ds $$ 과 같이 나타낼 수 있다. 이제 $x:= t -s$ 로 치환하면 $$ n = \lambda \int_{0}^{t} Q ( x) dx \\ m = \lambda \left( t - \int_{0}^{t} Q ( x) dx \right) $$ 과 같이 깔끔하게 정리된다. 우리는 이미 $n$ 을 알고 있으므로, $\lambda$ 의 추정치로써 $\displaystyle \hat{\lambda}:= {{ n } \over { \int_{0}^{t} Q ( x) dx }}$ 을 사용할 수 있다. 그러면 $$ m \approx {{ n } \over { \int_{0}^{t} Q ( x) dx }} \left( t - \int_{0}^{t} Q ( x) dx \right) $$ 이고, 잠복기의 확률밀도함수가 될 $Q’(x)$ 만 알면 보균자의 수가 근사적으로 구해진다.