logo

기하분포의 충분통계량과 최대우도추정량 📂확률분포론

기하분포의 충분통계량과 최대우도추정량

정리

기하분포를 따르는 랜덤샘플 X:=(X1,,Xn)Geo(p)\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim \text{Geo} \left( p \right) 이 주어져 있다고 하자. pp 에 대한 충분통계량 TT최대우도추정량 p^\hat{p} 는 다음과 같다. T=k=1nXkp^=nk=1nXk \begin{align*} T =& \sum_{k=1}^{n} X_{k} \\ \hat{p} =& {{ n } \over { \sum_{k=1}^{n} X_{k} }} \end{align*}

증명

충분통계량

f(x;p)=k=1nf(xk;p)=k=1np(1p)xk1=pn(1p)kxkn=pn(1p)kxkn1 \begin{align*} f \left( \mathbf{x} ; p \right) =& \prod_{k=1}^{n} f \left( x_{k} ; p \right) \\ =& \prod_{k=1}^{n} p \left( 1 - p \right)^{x_{k} - 1} \\ =& p^{n} \left( 1 - p \right)^{\sum_{k} x_{k} - n} \\ =& p^{n} \left( 1 - p \right)^{\sum_{k} x_{k} - n} \cdot 1 \end{align*}

네이만 인수분해 정리: 랜덤 샘플 X1,,XnX_{1} , \cdots , X_{n} 이 모수 θΘ\theta \in \Theta 에 대해 같은 확률질량/밀도함수 f(x;θ)f \left( x ; \theta \right) 를 가진다고 하자. 통계량 Y=u1(X1,,Xn)Y = u_{1} \left( X_{1} , \cdots , X_{n} \right)θ\theta충분통계량인 것은 다음을 만족하는 음이 아닌 두 함수 k1,k20k_{1} , k_{2} \ge 0 이 존재하는 것이다. f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn) f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) = k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) 단, k2k_{2}θ\theta 에 종속되지 않아야한다.

네이만 인수분해 정리에 따라 T:=kXkT := \sum_{k} X_{k}pp 에 대한 충분통계량이다.

최대우도추정량

logL(p;x)=logf(x;p)=logpn(1p)kxkn=nlogp+k=1nxklog(1p) \begin{align*} \log L \left( p ; \mathbf{x} \right) =& \log f \left( \mathbf{x} ; p \right) \\ =& \log p^{n} \left( 1 - p \right)^{\sum_{k} x_{k} - n} \\ =& n \log p + \sum_{k=1}^{n} x_{k} \log \left( 1 - p \right) \end{align*}

랜덤샘플의 로그우도함수는 위와 같고, 우도함수가 최대값이 되려면 pp 에 대한 편미분00 이 되는 것이므로 0=n1p11p(k=1nxkn)    np+n1p=11pk=1nxk    np(1p)=11pk=1nxk    1p=1nk=1nxk \begin{align*} & 0 = n {{ 1 } \over { p }} - {{ 1 } \over { 1 - p }} \left( \sum_{k=1}^{n} x_{k} - n \right) \\ \implies & {{ n } \over { p }} + {{ n } \over { 1 - p }} = {{ 1 } \over { 1 - p }} \sum_{k=1}^{n} x_{k} \\ \implies & {{ n } \over { p(1-p) }} = {{ 1 } \over { 1 - p }} \sum_{k=1}^{n} x_{k} \\ \implies & {{ 1 } \over { p }} = {{ 1 } \over { n }} \sum_{k=1}^{n} x_{k} \end{align*}

따라서 pp최대우도추정량 p^\hat{p} 는 다음과 같다. p^=nk=1nXk \hat{p} = {{ n } \over { \sum_{k=1}^{n} X_{k} }}