수리통계학에서의 통계량과 추정량
정의 1 2
- 확률 변수 $X$ 의 샘플 $X_{1} , \cdots , X_{n}$ 의 함수 $T$ 를 통계량statistic이라 한다. $$ T := T \left( X_{1} , \cdots , X_{n} \right) $$
- $X$ 의 분포 함수가 $f(x; \theta)$ 혹은 $p(x; \theta)$ 와 같이 나타날 때, $T$ 가 $\theta$ 를 파악하기 위한 통계량이면 $T$ 를 $\theta$ 의 추정량estimator이라고 한다.
- 통계량의 확률분포를 샘플링 분포sampling distribution라 한다.
설명
추정량(Estimator)의 실현(Realization)을 추정치estimate라고 한다. 모수는 보통 스칼라 $\theta \in \mathbb{R}$ 인 경우가 많으며, 이럴 때는 $T$ 를 $\theta$ 의 점추정량point estimator라도 부른다. 예로써 정규분포 $N \left( \mu, \sigma^{2} \right)$ 를 따르는 랜덤샘플이 있다고 할 때, 모평균 $\mu$ 의 추정량은 다음과 같다. $$ \overline{X} := {{ 1 } \over { n }} \sum_{k = 1}^{n} X_{k} $$ 실제 데이터 $x_{1} , \cdots , x_{n}$ 이 있다면 $\mu$ 의 추정치는 다음과 같다. $$ \overline{x} := {{ 1 } \over { n }} \sum_{k = 1}^{n} x_{k} $$
같이보기
기초통계학에서의 통계량
기초통계학에서는 샘플의 함수라고는 하지 않고 조금 더 직관적으로 ‘계산된 것’이라는 표현을 사용해서 정의했다. 본질적으로 같은 의미겠지만 신입생 내지 수학에 익숙하지 않은 사람에게 더 좋은 정의일 수 있다.
통계량의 예
평균이나 분산 같은 것들을 빼고 이름 자체에 ‘통계량’이 붙어있는 통계량에는 다음과 같은 예가 있다:
- 충분통계량: 분포에서 모수에 대한 모든 정보를 가지는 통계량이다.
- 최소충분통계량: 충분통계량 중에서 특정한 조건을 만족시키는 통계량이다.
- 보조통계량: 충분통계량이랑 반대로 모수에 대한 어떠한 정보도 가지지 않는 통계량이다.
- 완비통계량: 상식적으로 통계량이라면 이런 성질을 갖고 있어야한다고 할 때, 실제로 그 성질을 갖는 통계량이다.
추정량의 예
추정량에는 다음과 같은 예가 있다: