로케이션 패밀리의 충분통계량과 최대우도추정량

로케이션 패밀리의 충분통계량과 최대우도추정량

Sufficient statistiic and MLE of Location Family

정리

확률밀도함수가 $f_{X} \left( x ; \theta \right) = f_{X} \left( x - \theta \right)$ 인 로케이션 패밀리에서 얻은 랜덤샘플 $X_{1} , \cdots , X_{n} \sim X$ 이 주어져 있다고 하자. 충분통계량최대우도추정량

  • $X$ 의 서포트가 위로 유계면 $\max X_{k}$
  • $X$ 의 서포트가 아래로 유계면 $\min X_{k}$

에 종속된다.


  • 확률변수의 서포트란 확률밀도함수의 함수값이 $0$ 보다 큰 점들의 집합을 의미한다. $$ S_{X} := \left\{ x \in \mathbb{R} : f_{X} (x ; \theta) > 0 \right\} $$
  • 유계 집합이란 주어진 집합의 모든 원소에 대해서 크거나 같은 원소가 존재하는 집합을 말한다.

설명

예로써 일양분포 $U \left( 0, \theta \right)$ 에서 데이터 $$ 0.7 \\ 0.8 \\ 0.1 \\ 0.2 \\ 0.1 \\ 0.9 $$ 를 얻었다고 한다면, $\theta$ 의 충분통계량과 최대우도추정량은 당연히 가장 큰 값인 $0.9$ 다. 이와 같이 서포트 자체가 로케이션 파라메터 $\theta$ 에 종속된 경우엔 볼 것도 없이 $\min X_{k}$ 를 생각하면 된다. 지수분포도 마찬가지다.

증명

아래로 유계인 경우만 보이자. $X$ 의 서포트가 아래로 유계라는 것은 그 확률밀도함수가 지시함수 $I$ 에 대해 다음과 같이 나타나는 것과 동치다. $$ f_{X} ( x ; \theta ) = f_{X} ( x ; \theta ) I_{[\theta, \infty)} (x) $$

지시함수의 곱: $$ \prod_{i=1}^{n} I_{[\theta,\infty)} \left( x_{i} \right) = I_{[\theta,\infty)} \left( \min_{i \in [n]} x_{i} \right) $$

$I$ 가 미분가능한 함수가 아니라서 당황스러울 수 있는데 오히려 정의에 입각해서 생각하면 어려울 게 없다. 우도함수 $L$ 은 $$ L \left( \theta ; \mathbf{x} \right) = \prod_{k=1}^{n} f \left( x_{k} ; \theta \right) I_{[\theta, \infty)} \left( x_{k} \right) = I_{[\theta,\infty)} \left( \min_{{k} \in [n]} x_{k} \right) \prod_{k=1}^{n} f \left( x_{k} ; \theta \right) $$ 이므로, $\min x_{k}$ 이 $\theta$ 의 추정량 $\hat{\theta}$ 보다 작은 경우 얄짤없이 $0$ 이 곱해진다. 따라서 최대우도추정량은 $\min X_{k}$ 에 종속될 수 밖에 없고, $L$ 은 $X_{1} , \cdots , X_{n}$ 의 조인트 확률밀도함수와 같은 꼴을 가지고 있으니 네이만 인수분해 정리에 따라 충분통계량 역시 $\min X_{k}$ 에 대한 함수로 나타나야한다.

댓글