logo

정규분포의 충분통계량과 최대우도추정량 📂확률분포론

정규분포의 충분통계량과 최대우도추정량

정리

정규분포를 따르는 랜덤샘플 X:=(X1,,Xn)N(μ,σ2)\mathbf{X} := \left( X_{1} , \cdots , X_{n} \right) \sim N \left( \mu , \sigma^{2} \right) 이 주어져 있다고 하자.

(μ,σ2)\left( \mu, \sigma^{2} \right) 에 대한 충분통계량 TT최대우도추정량 (μ^,σ2^)\left( \hat{\mu}, \widehat{\sigma^{2}} \right) 는 다음과 같다. T=(kXk,kXk2)(μ^,σ2^)=(1nkXk,1nk(XkX)2) \begin{align*} T =& \left( \sum_{k} X_{k}, \sum_{k} X_{k}^{2} \right) \\ \left( \hat{\mu}, \widehat{\sigma^{2}} \right) =& \left( {{ 1 } \over { n }} \sum_{k} X_{k}, {{ 1 } \over { n }} \sum_{k} \left( X_{k} - \overline{X} \right)^{2} \right) \end{align*}

증명

충분통계량

f(x;λ)=k=1nf(xk;λ)=k=1n12πσexp[12(xkμσ)2]=12πnσnexp[12σ2k=1nxk2]exp[1σ2k=1nμxk]exp[12σ2nμ2]=μexp[μσ2k=1nxk12σ2nμ2]12πnσnexp[12σ2k=1nxk2]=σ12πnσnexp[12σ2k=1nxk2]exp[1σ2k=1nμxk]exp[12σ2nμ2]1 \begin{align*} f \left( \mathbf{x} ; \lambda \right) =& \prod_{k=1}^{n} f \left( x_{k} ; \lambda \right) \\ =& \prod_{k=1}^{n} {{ 1 } \over { \sqrt{2 \pi} \sigma }} \exp \left[ - {{ 1 } \over { 2 }} \left( {{ x_{k} - \mu } \over { \sigma }} \right)^{2} \right] \\ =& {{ 1 } \over { \sqrt{2 \pi}^{n} \sigma^{n} }} \exp \left[ - {{ 1 } \over { 2 \sigma^{2} }} \sum_{k=1}^{n} x_{k}^{2} \right] \exp \left[ {{ 1 } \over { \sigma^{2} }} \sum_{k=1}^{n} \mu x_{k} \right] \exp \left[ - {{ 1 } \over { 2 \sigma^{2} }} n \mu^{2} \right] \\ \overset{\mu}{=}& \exp \left[ {{ \mu } \over { \sigma^{2} }} \sum_{k=1}^{n} x_{k} - {{ 1 } \over { 2 \sigma^{2} }} n \mu^{2} \right] \cdot {{ 1 } \over { \sqrt{2 \pi}^{n} \sigma^{n} }} \exp \left[ - {{ 1 } \over { 2 \sigma^{2} }} \sum_{k=1}^{n} x_{k}^{2} \right] \\ \overset{\sigma}{=}& {{ 1 } \over { \sqrt{2 \pi}^{n} \sigma^{n} }} \exp \left[ - {{ 1 } \over { 2 \sigma^{2} }} \sum_{k=1}^{n} x_{k}^{2} \right] \exp \left[ {{ 1 } \over { \sigma^{2} }} \sum_{k=1}^{n} \mu x_{k} \right] \exp \left[ - {{ 1 } \over { 2 \sigma^{2} }} n \mu^{2} \right] \cdot 1 \end{align*}

네이만 인수분해 정리: 랜덤 샘플 X1,,XnX_{1} , \cdots , X_{n} 이 모수 θΘ\theta \in \Theta 에 대해 같은 확률질량/밀도함수 f(x;θ)f \left( x ; \theta \right) 를 가진다고 하자. 통계량 Y=u1(X1,,Xn)Y = u_{1} \left( X_{1} , \cdots , X_{n} \right)θ\theta충분통계량인 것은 다음을 만족하는 음이 아닌 두 함수 k1,k20k_{1} , k_{2} \ge 0 이 존재하는 것이다. f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn) f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) = k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) 단, k2k_{2}θ\theta 에 종속되지 않아야한다.

네이만 인수분해 정리에 따라 T:=(kXk,kXk2)T := \left( \sum_{k} X_{k}, \sum_{k} X_{k}^{2} \right)(μ,σ2)\left( \mu, \sigma^{2} \right) 에 대한 충분통계량이다.

최대우도추정량

logL(μ,σ2;x)=logf(x;μ,σ2)=nlogσ2π12σ2k=1nxk2+1σ2k=1nμxk12σ2nμ2 \begin{align*} \log L \left( \mu, \sigma^{2} ; \mathbf{x} \right) =& \log f \left( \mathbf{x} ; \mu, \sigma^{2} \right) \\ =& - n \log \sigma \sqrt{2 \pi} - {{ 1 } \over { 2 \sigma^{2} }} \sum_{k=1}^{n} x_{k}^{2} + {{ 1 } \over { \sigma^{2} }} \sum_{k=1}^{n} \mu x_{k} - {{ 1 } \over { 2 \sigma^{2} }} n \mu^{2} \end{align*}

랜덤샘플의 로그우도함수는 위와 같고, 우도함수가 최대값이 되려면 μ,σ\mu, \sigma 에 대한 편미분00 이 되어야 한다. 먼저 μ\mu 에 대한 편미분이 00 이려면 0=1σ2k=1nxk1σ2nμ    μ=1nk=1nxk \begin{align*} & 0 = {{ 1 } \over { \sigma^{2} }} \sum_{k=1}^{n} x_{k} - {{ 1 } \over { \sigma^{2} }} n \mu \\ \implies & \mu = {{ 1 } \over { n }} \sum_{k=1}^{n} x_{k} \end{align*}

이므로, σ\sigma 에 관계 없이 μ^=k=1nXk/n\hat{\mu} = \sum_{k=1}^{n} X_{k} / n 이고 σ\sigma 에 대한 편미분이 00 이려면 0=nσ+1σ3k=1nxk22σ3k=1nμxk+1σ3nμ2    nσ2=k=1nxk22k=1nμxk+nμ2    σ2=1nk=1n(xkμ)2 \begin{align*} & 0 = - {{ n } \over { \sigma }} + {{ 1 } \over { \sigma^{3} }} \sum_{k=1}^{n} x_{k}^{2} - {{ 2 } \over { \sigma^{3} }} \sum_{k=1}^{n} \mu x_{k} + {{ 1 } \over { \sigma^{3} }} n \mu^{2} \\ \implies & n \sigma^{2} = \sum_{k=1}^{n} x_{k}^{2} - 2 \sum_{k=1}^{n} \mu x_{k} + n \mu^{2} \\ \implies & \sigma^{2} = {{ 1 } \over { n }} \sum_{k=1}^{n} \left( x_{k} - \mu \right)^{2} \end{align*}

이므로, μ^=μ^=k=1nXk/n\hat{\mu} = \hat{\mu} = \sum_{k=1}^{n} X_{k} / n 에 대해 σ2^=k=1n(Xkμ)2/n\widehat{\sigma^{2}} = \sum_{k=1}^{n} \left( X_{k} - \mu \right)^{2} / n 이다.