logo

네이만 인수분해 정리 증명 📂수리통계학

네이만 인수분해 정리 증명

정리

랜덤 샘플 X1,,XnX_{1} , \cdots , X_{n} 이 모수 θΘ\theta \in \Theta 에 대해 같은 확률질량/밀도함수 f(x;θ)f \left( x ; \theta \right) 를 가진다고 하자. 통계량 Y=u1(X1,,Xn)Y = u_{1} \left( X_{1} , \cdots , X_{n} \right)θ\theta충분통계량인 것은 다음을 만족하는 음이 아닌 두 함수 k1,k20k_{1} , k_{2} \ge 0 이 존재하는 것이다. f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn) f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) = k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) 단, k2k_{2}θ\theta 에 종속되지 않아야한다.

증명

충분통계량의 정의: θΘ\theta \in \Theta 에 종속되지 않은 H(x1,,xn)H \left( x_{1} , \cdots , x_{n} \right) 에 대해 f(x1;θ)f(xn;θ)fY1(u1(x1,,xn);θ)=H(x1,,xn) {{ f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) } \over { f_{Y_{1}} \left( u_{1} \left( x_{1} , \cdots, x_{n} \right) ; \theta \right) }} = H \left( x_{1} , \cdots , x_{n} \right) 이면 Y1Y_{1}θ\theta 에 대한 충분통계량sufficient statistic이라 한다.

연속 확률 분포에 대해서만 증명1한다. 이산 확률 분포에 대한 증명2은 카셀라를 참고하라.


()(\Rightarrow)

충분통계량의 정의에서 fY1f_{Y_{1}}k1k_{1}, HHf2f_{2} 에 해당하므로 자명하다.


()(\Leftarrow)

y1:=u1(x1,,xn)y2:=u2(x1,,xn)yn:=un(x1,,xn) \begin{align*} y_{1} &:= u_{1} \left( x_{1} , \cdots , x_{n} \right) \\ y_{2} &:= u_{2} \left( x_{1} , \cdots , x_{n} \right) \\ &\vdots \\ y_{n} &:= u_{n} \left( x_{1} , \cdots , x_{n} \right) \end{align*}

편의상 위 함수들의 역함수를 다음과 같이 두고 자코비안JJ 로 나타내자.

x1:=w1(y1,,yn)x2:=w2(y1,,yn)xn:=wn(y1,,yn) \begin{align*} x_{1} &:= w_{1} \left( y_{1} , \cdots , y_{n} \right) \\ x_{2} &:= w_{2} \left( y_{1} , \cdots , y_{n} \right) \\ &\vdots \\ x_{n} &:= w_{n} \left( y_{1} , \cdots , y_{n} \right) \end{align*}

그러면 Y1,,YnY_{1} , \cdots , Y_{n}조인트 확률밀도함수 ggwi=wi(y1,,yn)w_{i} = w_{i} \left( y_{1} , \cdots , y_{n} \right) 에 대해 g(y1,,yn;θ)=k1(y1;θ)k2(w1,,wn)J g \left( y_{1} , \cdots , y_{n} ; \theta \right) = k_{1} \left( y_{1} ; \theta \right) k_{2} \left( w_{1} , \cdots , w_{n} \right) \left| J \right| 이고, Y1Y_{1}마지널 확률밀도함수 fY1f_{Y_{1}}fY1(y1;θ)=g(y1,,yn;θ)dy2dyn=k1(y1;θ)Jk2(w1,,wn)dy2dyn \begin{align*} f_{Y_{1}} \left( y_{1} ; \theta \right) =& \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} g \left( y_{1} , \dots , y_{n} ; \theta \right) d y_{2} \cdots d y_{n} \\ =& k_{1} \left( y_{1} ; \theta \right) \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} \left| J \right| k_{2} \left( w_{1} , \dots , w_{n} \right) d y_{2} \cdots d y_{n} \end{align*} k2k_{2}θ\theta 에 종속되지 않는 함수면서 JJ 역시 θ\theta 가 개입되지 않았으므로 우변에서 n1n-1중 적분은 θ\theta 에 무관한 y1y_{1} 만의 함수로 나타낼 수 있다. 이를 임시로 m(y1)m \left( y_{1} \right) 이라 적어보면 fY1(y1;θ)=k1(y1;θ)m(y1) f_{Y_{1}} \left( y_{1} ; \theta \right) = k_{1} \left( y_{1} ; \theta \right) m \left( y_{1} \right) 여기서 만약 m(y1)=0m \left( y_{1} \right) = 0 이면 자명하게 fY1(y1;θ)=0f_{Y_{1}} \left( y_{1} ; \theta \right) = 0 이다. 이제 m(y1)>0m \left( y_{1} \right) > 0 이라 가정해보면 다음과 같이 적을 수 있다. k1[u1(x1,,xn);θ]=fY1[u1(x1,,xn);θ]m[u1(x1,,xn)] k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] = {{ f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} 가정에서 주어진 식에 대입하면 f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn)=fY1[u1(x1,,xn);θ]m[u1(x1,,xn)]k2(x1,,xn)=fY1[u1(x1,,xn);θ]k2(x1,,xn)m[u1(x1,,xn)] \begin{align*} f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) =& k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) \\ =& {{ f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} k_{2} \left( x_{1} , \cdots , x_{n} \right) \\ =& f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] {{ k_{2} \left( x_{1} , \cdots , x_{n} \right) } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} \end{align*} k2k_{2}mm 둘 다 θ\theta 에 종속되지 않으므로, 정의에 따라 Y1Y_{1}θ\theta 의 충분통계량이다.


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p392. ↩︎

  2. Casella. (2001). Statistical Inference(2nd Edition): p276. ↩︎