ポアソン分布の十分統計量と最尤推定量
定理
ポアソン分布に従うランダムサンプル $\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Poi} \left( \lambda \right)$ が与えられたとしよう。
$\lambda$ に対する十分統計量 $T$ と最尤推定量 $\hat{\lambda}$ は次の通りだ。 $$ \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{\lambda} =& {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} \end{align*} $$
証明
十分統計量
$$ \begin{align*} f \left( \mathbf{x} ; \lambda \right) =& \prod_{k=1}^{n} f \left( x_{k} ; \lambda \right) \\ =& \prod_{k=1}^{n} {{ e^{-\lambda} \lambda^{x_{k}} } \over { x_{k} ! }} \\ =& {{ e^{-n \lambda} \lambda^{ \sum_{k} x_{k}} } \over { \prod_{k} x_{k} ! }} \\ =& e^{-n \lambda} \lambda^{ \sum_{k} x_{k}} \cdot {{ 1 } \over { \prod_{k} x_{k} ! }} \end{align*} $$
ネイマン因子分解定理:ランダムサンプル $X_{1} , \cdots , X_{n}$ がパラメーター $\theta \in \Theta$ に対して同じ確率質量/密度関数 $f \left( x ; \theta \right)$ を持つとする。統計量 $Y = u_{1} \left( X_{1} , \cdots , X_{n} \right)$ が$\theta$ の十分統計量であるのは、次を満たす二つの非負の関数 $k_{1} , k_{2} \ge 0$ が存在することである。 $$ f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) = k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) $$ ただし、$k_{2}$ は$\theta$ に依存してはならない。
ネイマン因子分解定理により、$T := \sum_{k} X_{k}$ は$\lambda$ に対する十分統計量である。
最尤推定量
$$ \begin{align*} \log L \left( \lambda ; \mathbf{x} \right) =& \log f \left( \mathbf{x} ; \lambda \right) \\ =& \log {{ e^{-n \lambda} \lambda^{ \sum_{k} x_{k}} } \over { \prod_{k} x_{k} ! }} \\ =& -n\lambda + \sum_{k=1}^{n} x_{k} \log \lambda - \log \prod_{k} x_{k} ! \end{align*} $$
ランダムサンプルの対数尤度関数は上記の通りであり、尤度関数が最大値となるためには、$\lambda$ に対する偏微分が $0$ でなければならないので、 $$ \begin{align*} & 0 = - n + \sum_{k=1}^{n} x_{k} {{ 1 } \over { \lambda }} \\ \implies & \lambda = {{ 1 } \over { n }} \sum_{k=1}^{n} x_{k} \end{align*} $$
したがって、$\lambda$ の最尤推定量 $\hat{\lambda}$ は次の通りである。 $$ \hat{\lambda} = {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} $$
■