logo

指数分布とポアソン分布の関係 📂確率分布論

指数分布とポアソン分布の関係

説明

指数分布ポアソン分布の直感的な定義について考えてみよう。指数分布は、あるイベントが発生するまでにかかる時間に関心があり、ポアソン分布は単位時間内にあるイベントが何回発生するかに関心がある。イベントが発生する時間と、イベントが発生する回数について、二つの分布は一方を固定して他方に関心を持つ。例えば、$\exp (\lambda)$と$\text{Poi}(\lambda)$のパラメータを$\lambda = 1$とすることを考えよう。指数分布を見た場合、イベントが発生するまでの単位時間であり、ポアソン分布を見た場合、単位時間あたりにイベントが一回発生すると見ることができる。

ここで、ポアソン分布の$\lambda$が大きくなれば、単位時間あたりのイベントの発生回数が大きくなり、その分イベントが一回発生する時間は短くなるはずだ。この意味で、指数分布の平均$\displaystyle {{1} \over {\lambda}}$ポアソン分布の平均$\lambda$は、パラメータを表す記号$\lambda$を共有するのが妥当だと考えられる。多くの教科書で、二つの分布のパラメータを$\lambda$と表記するが、このように考えると受け入れやすくなるだろう。

数学的には、ガンマ分布と指数分布が関連しており、ガンマ分布がポアソン分布と関連しているので、指数分布とポアソン分布も何らかの関係があることを容易に推測できるだろう。

Proof

According to the relationship between the gamma distribution and the exponential distribution, $$ X_{i} \sim \exp (\lambda) \iff X_{i} \sim \Gamma (1, {{1} \over {\lambda}} ) $$ If you add all $k$ random variables following the gamma distribution, $$ Y_{k} = \sum_{i=1}^{k} X_{i} \sim \Gamma (n, {{1} \over {\lambda}} ) $$ Since the exponential distribution is memoryless, $Y_{i}$ and $Y_{j}$ are independent, and $Y_{k}$ simply represents the time at which the $k$th event occurs. Meanwhile, if the cumulative distribution function of $\displaystyle Y_{k}$ is called $F_{k}$, $$ F_{k}(1) = 1 - \int_{1}^{\infty} { {1} \over {\Gamma (k) {{1} \over {\lambda ^ k}} }} x^{k-1} e^{-\lambda x} dx $$ To summarize, $$ F_{k}(1) = 1 - \int_{1}^{\infty} { { \lambda^{k} } \over {\Gamma (k) }} x^{k-1} e^{-\lambda x} dx $$ If we substitute $\lambda x = z$ with $\lambda dx = dz$, $$ F_{k}(1) = 1 - \int_{\lambda}^{\infty} { { z^{k-1} e^{- z } } \over {\Gamma (k) }} dz $$ According to the relationship between gamma distribution and Poisson distribution, $$ F_{k}(1) = 1 - \int_{\lambda}^{\infty} { { z^{k-1} e^{-z} } \over { \Gamma (k) } } dz = 1 - \sum_{y=0}^{k-1} { { {\lambda}^{y} e^{-\lambda} } \over {y!} } $$ Since $Y_{k}$ represents the time at which the $k$th event occurs, the probability that exactly $n$ events occur within unit time $1$ is the same as the probability that $Y_{n}$ is less than or equal to $1$ and $Y_{n+1}$ is greater than $1$. $$ \begin{align*} P(N = n) =& P( Y_{n} \le 1 \land Y_{n+1}>1 ) \\ =& P( Y_{n} \le 1 ) P ( Y_{n+1}>1 ) \\ =& P( Y_{n} \le 1 ) \left( 1 - P ( Y_{n+1} \le 1 ) \right) \\ =& P( Y_{n} \le 1 ) - P( Y_{n} \le 1 ) P ( Y_{n+1} \le 1 ) \\ =& P( Y_{n} \le 1 ) - P( Y_{n} \le 1 \land Y_{n+1} \le 1 ) \\ =& P( Y_{n} \le 1 ) - P( Y_{n+1} \le 1 ) \\ =& F_{n}(1) - F_{n+1}(1) \\ =& \left( 1 - \sum_{y=0}^{n-1} { { {\lambda}^{y} e^{-\lambda} } \over {y!} } \right) - \left( 1 - \sum_{y=0}^{n} { { {\lambda}^{y} e^{-\lambda} } \over {y!} } \right) \\ =& { { {\lambda}^{n} e^{-\lambda} } \over {n!} } \end{align*} $$ This refers to the probability mass function of the Poisson distribution with parameter $\lambda$, thus $N \sim \text{Poi} (\lambda)$

See Also