logo

로케이션 패밀리의 충분통계량과 최대우도추정량 📂수리통계학

로케이션 패밀리의 충분통계량과 최대우도추정량

정리

확률밀도함수fX(x;θ)=fX(xθ)f_{X} \left( x ; \theta \right) = f_{X} \left( x - \theta \right)로케이션 패밀리에서 얻은 랜덤샘플 X1,,XnXX_{1} , \cdots , X_{n} \sim X 이 주어져 있다고 하자. 충분통계량최대우도추정량

  • XX 의 서포트가 위로 유계면 maxXk\max X_{k}
  • XX 의 서포트가 아래로 유계면 minXk\min X_{k}

에 종속된다.


  • 확률변수의 서포트란 확률밀도함수의 함수값이 00 보다 큰 점들의 집합을 의미한다. SX:={xR:fX(x;θ)>0} S_{X} := \left\{ x \in \mathbb{R} : f_{X} (x ; \theta) > 0 \right\}
  • 유계 집합이란 주어진 집합의 모든 원소에 대해서 크거나 같은 원소가 존재하는 집합을 말한다.

설명

예로써 일양분포 U(0,θ)U \left( 0, \theta \right) 에서 데이터 0.70.80.10.20.10.9 0.7 \\ 0.8 \\ 0.1 \\ 0.2 \\ 0.1 \\ 0.9 를 얻었다고 한다면, θ\theta 의 충분통계량과 최대우도추정량은 당연히 가장 큰 값인 0.90.9 다. 이와 같이 서포트 자체가 로케이션 파라미터 θ\theta 에 종속된 경우엔 볼 것도 없이 minXk\min X_{k} 를 생각하면 된다. 지수분포도 마찬가지다.

증명

아래로 유계인 경우만 보이자. XX 의 서포트가 아래로 유계라는 것은 그 확률밀도함수가 지시함수 II 에 대해 다음과 같이 나타나는 것과 동치다. fX(x;θ)=fX(x;θ)I[θ,)(x) f_{X} ( x ; \theta ) = f_{X} ( x ; \theta ) I_{[\theta, \infty)} (x)

지시함수의 곱: i=1nI[θ,)(xi)=I[θ,)(mini[n]xi) \prod_{i=1}^{n} I_{[\theta,\infty)} \left( x_{i} \right) = I_{[\theta,\infty)} \left( \min_{i \in [n]} x_{i} \right)

II 가 미분가능한 함수가 아니라서 당황스러울 수 있는데 오히려 정의에 입각해서 생각하면 어려울 게 없다. 우도함수 LLL(θ;x)=k=1nf(xk;θ)I[θ,)(xk)=I[θ,)(mink[n]xk)k=1nf(xk;θ) L \left( \theta ; \mathbf{x} \right) = \prod_{k=1}^{n} f \left( x_{k} ; \theta \right) I_{[\theta, \infty)} \left( x_{k} \right) = I_{[\theta,\infty)} \left( \min_{{k} \in [n]} x_{k} \right) \prod_{k=1}^{n} f \left( x_{k} ; \theta \right) 이므로, minxk\min x_{k}θ\theta 의 추정량 θ^\hat{\theta} 보다 작은 경우 얄짤없이 00 이 곱해진다. 따라서 최대우도추정량은 minXk\min X_{k} 에 종속될 수 밖에 없고, LLX1,,XnX_{1} , \cdots , X_{n}조인트 확률밀도함수와 같은 꼴을 가지고 있으니 네이만 인수분해 정리에 따라 충분통계량 역시 minXk\min X_{k} 에 대한 함수로 나타나야한다.