logo

신뢰구간의 쉬운 정의 📂수리통계학

신뢰구간의 쉬운 정의

정의 1

확률 밀도 함수 f(x;θ)f (x; \theta) 를 가지는 확률 변수 XX샘플 X1,,XnX_{1} , \cdots , X_{n}신뢰 계수confidence Coefficient α(0,1)\alpha \in (0,1) 가 주어져 있다고 하자. L:=L(X1,,Xn)U:=U(X1,,Xn) L := L \left( X_{1} , \cdots , X_{n} \right) \\ U := U \left( X_{1} , \cdots , X_{n} \right) 통계량 L<UL < U 가 위와 같이 정의되어있다고 할 때, 다음을 만족하는 구간 (L,U)R(L,U) \subset \mathbb{R}모수 θ\theta 에 대한 (1α)100%( 1 - \alpha)100 \% 신뢰구간이라 한다. 1α=P[θ(L,U)] 1-\alpha = P \left[ \theta \in \left( L,U \right) \right]

설명

사실 신뢰 구간은 R\mathbb{R} 보다 넓은 공간에서 신뢰 영역으로 일반화할 수 있고, 기초 통계학을 익히는 입장에서는 위와 같이 수식으로 정의하는 게 쓸데없이 어려울 수 있다. 그러나 이제는 확률 변수, 샘플, 통계량이란 무엇인가 등에 대한 정의가 수리적으로 탄탄해졌으니 조금 더 엄밀한 논의를 이어나갈 수 있다.

이러한 신뢰 구간의 정의에서 중요한 것은 LLUU 가 통계량이라는 것이다. 신뢰 구간이라는 것이 구간으로 주어져 있어서 공간적인 감각으로 신뢰구간을 볼 수도 있겠지만, 사실 수리통계 이전의 통계학에서 구하던 신뢰 구간은 그 상한 UU 와 하한 LL 을 구함으로써 찾았을 것이다. 가령 XX표준정규분포 N(0,1)N(0,1) 을 따른다면 μ\mu 에 대한 1α1-\alpha 신뢰구간은 다음과 같이 구했다. L:=XSnzα/2U:=X+Snzα/2 L := \overline{X} - {{ S } \over { \sqrt{n} }} z_{\alpha/2} \\ U := \overline{X} + {{ S } \over { \sqrt{n} }} z_{\alpha/2} 이렇게 신뢰 구간을 찾는 μ\mu 에 대한 구간 추정interval estimation에서 실제로 움직이는 것, 그러니까 확률 변수는 구간의 양끝인 L,UL,U 라는 것에 주의하자. 수식에서 언뜻 보기에는 구간이 주어져있고 μ\mu 가 랜덤하게 바뀌면서 신뢰 구간 안에 들어가는지의 확률에 관심이 있는 것 같지만, 굳이 L,UL,U 를 ‘통계량’이라는 단어로 부르는 것부터가 그러한 오독을 해소하기 위함이다.

같이보기


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p218. ↩︎