logo

신뢰구간의 쉬운 정의 📂수리통계학

신뢰구간의 쉬운 정의

정의 1

확률 밀도 함수 $f (x; \theta)$ 를 가지는 확률 변수 $X$ 의 샘플 $X_{1} , \cdots , X_{n}$ 와 신뢰 계수confidence Coefficient $\alpha \in (0,1)$ 가 주어져 있다고 하자. $$ L := L \left( X_{1} , \cdots , X_{n} \right) \\ U := U \left( X_{1} , \cdots , X_{n} \right) $$ 통계량 $L < U$ 가 위와 같이 정의되어있다고 할 때, 다음을 만족하는 구간 $(L,U) \subset \mathbb{R}$ 을 모수 $\theta$ 에 대한 $( 1 - \alpha)100 \%$ 신뢰구간이라 한다. $$ 1-\alpha = P \left[ \theta \in \left( L,U \right) \right] $$

설명

사실 신뢰 구간은 $\mathbb{R}$ 보다 넓은 공간에서 신뢰 영역으로 일반화할 수 있고, 기초 통계학을 익히는 입장에서는 위와 같이 수식으로 정의하는 게 쓸데없이 어려울 수 있다. 그러나 이제는 확률 변수, 샘플, 통계량이란 무엇인가 등에 대한 정의가 수리적으로 탄탄해졌으니 조금 더 엄밀한 논의를 이어나갈 수 있다.

이러한 신뢰 구간의 정의에서 중요한 것은 $L$ 과 $U$ 가 통계량이라는 것이다. 신뢰 구간이라는 것이 구간으로 주어져 있어서 공간적인 감각으로 신뢰구간을 볼 수도 있겠지만, 사실 수리통계 이전의 통계학에서 구하던 신뢰 구간은 그 상한 $U$ 와 하한 $L$ 을 구함으로써 찾았을 것이다. 가령 $X$ 가 표준정규분포 $N(0,1)$ 을 따른다면 $\mu$ 에 대한 $1-\alpha$ 신뢰구간은 다음과 같이 구했다. $$ L := \overline{X} - {{ S } \over { \sqrt{n} }} z_{\alpha/2} \\ U := \overline{X} + {{ S } \over { \sqrt{n} }} z_{\alpha/2} $$ 이렇게 신뢰 구간을 찾는 $\mu$ 에 대한 구간 추정interval Estimation에서 실제로 움직이는 것, 그러니까 확률 변수는 구간의 양끝인 $L,U$ 라는 것에 주의하자. 수식에서 언뜻 보기에는 구간이 주어져있고 $\mu$ 가 랜덤하게 바뀌면서 신뢰 구간 안에 들어가는지의 확률에 관심이 있는 것 같지만, 굳이 $L,U$ 를 ‘통계량’이라는 단어로 부르는 것부터가 그러한 오독을 해소하기 위함이다.

같이보기


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p218. ↩︎