수리통계적인 신뢰집합의 정의 📂수리통계학

수리통계적인 신뢰집합의 정의

정의 ¹

모수 $\theta$ 의 구간추정량 $\left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right]$ 에 대해 다음을 커버리지 확률^{coverage Probability}라 한다. $$ P_{\theta} \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] \right) = P \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] | \theta \right) $$
커버리지 확률의 인피멈을 신뢰계수^{confidence coefficient}라 한다. $$ \inf_{\theta} P_{\theta} \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] \right) $$

설명

신뢰구간

신뢰계수는 신뢰수준^{confidence level}과 같은 말이고, 구간추정량과 신뢰수준이 함께 등장하게 될 때 우리는 그 구간을 신뢰구간^{confidence Interval}이라 한다.

정말 쓸데없는 말 다 쳐내고, 오직 수학적인 진술로써, 구간추정량의 정의에서 구간추정량은 어디까지나 통계량으로 만들어진 랜덤 인터벌이라고 했다. 이렇게 담백하게 수리통계적으로 된 정의를 보면 신뢰구간이 무엇인지 이제야 좀 느낌이 올 것이다. 교양 통계학에서의 설명과 베이지안의 신용구간과의 차이를 설명할 때 $N$ 개의 신뢰구간을 만든다면 어쩌고 저쩌고 모수의 분포가 없어서 어쩌고 저쩌고 했던 것들이 딱 아래의 표현으로 요약된다. $$ P \left( \theta \in \left[ L \left( \mathbf{X} \right), U \left( \mathbf{X} \right) \right] | \theta \right) $$ 움직이는 것, 변하는 것, 랜덤한 것은 늘 신뢰구간 그 자체였지 $\theta$ 였던 적이 없다. 수식에서 보이듯 $\theta$ 는 상수니까 주어져서 가만히 있는 것이고, 그 위아래가 왔다갔다 하는 것이다. 우리는 $\theta$ 의 분포도 모르지만, 애초에 상수여서 알 필요도 없다.

왜 그렇게 헷갈렸나

이렇게 생각할 수 없었던 것은 대다수의 여러분들이 신뢰구간이 구체적으로 숫자로 적힌 걸 봐왔기 때문이다. 가령 평균이 $3.14$ 고 신뢰수준 $95 \%$ 에서 신뢰구간이 $[3.00, 3.28]$ 이라고 해보자.

미치지 않고서야 이걸 처음 보고 신뢰구간이 움직인다고 볼 사람은 없다. 평범한 인간의 직관은 "아, 그러니까 $3.14$ 라는 값이 $[3.00, 3.28]$ 안에 있을 확률이 $95\%$ 라는 거지? 그런데 $5\%$ 의 확률로는 그 밖에 나갈수도 있는거고? 그래서 우리가 이걸 믿더라도 완전히 믿지는 말고 95% 정도로 믿어야겠네?"라고 생각하는 게 당연하다.
움직여도 $3.14$ 가 $3.30$ 이 되어서 벗어나는 걸 상상하지 신뢰구간이 $[2.00, 2.28]$ 으로 뽑혀서 $3.14$ 를 커버하지 못하는 식으로 벗어날거라고는 생각할 수가 없다. $3.00 = L \left( \mathbf{x} \right)$ 이고, $3.28 = U \left( \mathbf{x} \right)$ 다.

신뢰집합으로의 일반화

사실 커버리지 확률을 통해 신뢰구간을 정의함에 있어서 구간추정량의 성질이 전혀 필요하지 않았다. 예컨대 위상수학적인 연결성 따위의 가정이 전혀 필요없는 것인데, 이에 따라 구간에서 탈피해 집합 자체로 일반화한 것을 신뢰집합^{confidence set}이라 한다. 신뢰집합은 당연히 모수공간 $\Theta$ 의 부분집합이며, 샘플 $\mathbf{X}$ 에 종속된 랜덤 집합^{random set} $C \left( \mathbf{X} \right)$ 과 같이 나타낸다.

같이보기

신뢰구간의 쉬운 정의

Casella. (2001). Statistical Inference(2nd Edition): p418. ↩︎