指数分布によるポアソン過程の定義 📂確率論

指数分布によるポアソン過程の定義

定義

$\tau_{1} , \tau_{2} , \cdots \sim \text{exp} ( \lambda )$ と定義しよう。

$\lambda$ を強度と呼ぶ。 2. $\displaystyle s_{n}:= \sum_{k=1}^{n} \tau_{k}$ を 到達時間という。 3. $N_{t}:= \begin{cases} 0 , & 0 \le t < s_{1} \\ k , & s_{k} \le t < s_{k+1} \end{cases}$ のように定義された確率過程 $\left\{ N_{t} \right\}_{t = 0}^{\infty}$ を ポアソン過程と呼ぶ。

基本性質

[1]: $\displaystyle p (N_{t} = k ) = {{ ( \lambda t )^{t} e^{ - \lambda t} } \over { k! }}$
[2]: $\displaystyle p \left( ( N_{t} - N_{s} ) = k \right) = {{ ( \lambda (t - s ) )^{t} e^{ - \lambda ( t - s )} } \over { k! }}$
[3]: $E ( N_{t} - N_{s} ) = \lambda (t - s)$
[4]: $\Var ( N_{t} - N_{s} ) = \lambda ( t - s)$

説明

$\displaystyle E ( \tau_{i} ) = {{1} \over {\lambda }}$ であるから、強度が高いというのは $\tau_{i}$ が短く、事件が頻繁に発生することを意味する。微分素行列を通じたポアソン過程の定義を比較すると、到達時間が連続マルコフ連鎖に従うのがよく分からない代わりに指数分布がすぐに見える。

定義だけを見た場合、これがなぜポアソン過程と呼ばれるのか理解するのは難しいが、指数分布とポアソン分布の関係を知っていれば、難しくはないと受け入れやすいだろう。証明は本質的に同じだ。

[3]と[4]の証明は、ポアソン分布の平均、分散と本質的に同じだ。

例

ポアソン過程は、在庫管理や疫学調査など幅広い分野で有用である。例として、伝染病が流行する状況を考えてみよう。

政府と関連機関は、できるだけ早くこれに対する対策を打たなければならないし、自然と、現在の状況を把握することが最優先だ。通常、伝染病には潜伏期があり、実際に症状が出た「患者」以外にも、まだ症状が現れていない「保菌者」がいる。この保菌者の数を正確に把握できないと、将来のワクチン需要を満たすことができなくなる可能性がある。

今、潜伏期 $\tau$ が累積密度関数 $Q ( r ):= p ( \tau \le r )$ を持つ確率変数だとしよう。そして、$N_{1;t}$ が現在の患者数、$N_{2;t}$ が現在の保菌者数だとする。$N_{1;t}$, $N_{2;t}$ はポアソン過程であり、感染した全個体数もまだポアソン過程 $N_{t}:= N_{1;t} + N_{2;t}$ のように表されるだろう。

ポアソン分布の加算: $X_i \sim \text{Poi}( m_{i} )$ ならば $$\sum_{i=1}^{n} X_{i} \sim \text{Poi} \left( \sum_{i=1}^{n} m_{i} \right)$$

個人が初めてウイルスに接触した瞬間を $s$、現在を $t$ とすると、$(t - s) > \tau$ の時に症状が現れる。$Q ( t - s ) = p ( \tau \le t - s )$ であるから、現時点での患者数の期待値は $$ n: = E ( N_{1;t} ) = \lambda \int_{0}^{t} Q (t - s ) ds $$ であり、保菌者数の期待値は $$ m: = E ( N_{2;t} ) = \lambda \int_{0}^{t} \left[ 1 - Q (t - s ) \right] ds $$ のように表される。今、$x:= t -s$ に置き換えると $$ n = \lambda \int_{0}^{t} Q ( x) dx \\ m = \lambda \left( t - \int_{0}^{t} Q ( x) dx \right) $$ と同様にきれいにまとめられる。既に $n$ を知っているので、$\lambda$ の推定値として $\displaystyle \hat{\lambda}:= {{ n } \over { \int_{0}^{t} Q ( x) dx }}$ を使用することができる。それならば $$ m \approx {{ n } \over { \int_{0}^{t} Q ( x) dx }} \left( t - \int_{0}^{t} Q ( x) dx \right) $$ であり、潜伏期の確率密度関数が $Q’(x)$ であれば、保菌者の数が近似的に求められる。