logo

신용구간과 신뢰구간의 차이 📂수리통계학

신용구간과 신뢰구간의 차이

요약

신용구간과 신뢰구간의 차이는 실로 베이지안과 프리퀀티스트의 차이라고 볼 수 있다.

  • 신뢰구간(프리퀀티스트): 모수는 고정된 상수고, 신뢰구간이 랜덤으로 구해진다.
  • 신용구간(베이지안): 모수도 분포를 가진 변수고, 신용구간도 사후분포로 구해진다.

신뢰구간

고전통계에서 모수 μ\mu 에 대한 95%95 \% 신뢰구간 [a,b][a , b] 이 의미하는 것은 같은 방법으로 만들어진 신뢰구간 100100 개가 있다고 하면 그 중에서 9595 개 정도가 μ[a,b]\mu \in [a,b] 를 만족한다는 것이다. 수식으로 간단하게 표현하면 p(μ[a,b])=95%p ( \mu \in [a,b] ) = 95 \% 인데, 상식과는 달리 이에 대한 해석이 무척 난해하다. 분명 같은 식이지만 이는 다음과 같이 다른 뉘앙스로 읽을 수 있다.

  1. μ\mu[a,b][a,b] 에 포함될 확률이 95%95 \% 다. (X)
  2. [a,b][a,b]μ\mu 를 포함할 확률이 95%95 \% 다. (O)

물론 위의 두 문장은 같은 말이지만, 읽는 사람은 말 그 자체가 아니라 뉘앙스의 차이를 느낄 수 있어야한다. 말하자면 μ\mu신뢰구간 [a,b][a , b] 에 있을 확률이 95%95 \% 인 것이 아니라 신뢰구간을 만드는 과정에 따르면 nn 개의 95%95 \% 신뢰구간 [a,b][a , b] 들 중 μ\mu 를 포함하는 신뢰구간이 전체에서 95%95 \% 정도 있다는 것이다.

우리가 알고 싶은 모수 μ\mu 자체는 분포를 알 수 없는 상수고, 대신 신뢰구간의 상한과 하한인 a,ba,b 는 그 분포를 알기 때문에 a<μa < \mu 이면서 μ<b \mu < b 인 경우를 생각할 수 있는 것이다. 이 미묘한 차이 때문에 신뢰구간은 우리의 직관과 정확히 일치하지 않는다. 그래서 이렇게 상식적이고 쉬운 개념을 설명하는데에도 몇개를 만들면 그 중에 몇개는 포함하네마네 하는 지저분한 설명이 동반된다.

애초에 μ\mu 를 기준으로 놓고 보면 μ\mu 에 대해 어떤 분포가 정의된 적이 없기 때문에 p(μ[a,b])p ( \mu \in [a,b] ) 이라는 표현부터가 말이 안 된다. 누가 대뜸 XX 의 분포도 말해주지 않고 P(0X2)P \left( 0 \le X \le 2 \right) 의 값이 몇이냐고 물어본다면 적잖이 당황스러울텐데, 신뢰구간에 대한 잘못된 해석이 딱 이와 같다.

프리퀀티스트의 관점에서 모수 μ\mu 는 고정된 상수로써 존재하며, 표본에 따라 달라지는 것은 신뢰구간 그 자체다. 마치 지금의 표본이 모집단과 비슷할 것이라고 가정하는 것처럼, 하나의 신뢰구간을 만들고는 이 신뢰구간이 아직 만들지 않은 나머지 신뢰구간과 비슷할 것이라고 보는 것이다.

신용구간

모수공간 Θ\Theta 의 부분집합 CΘC \subset \Theta유의수준 α\alpha 에 대해 P(θCy)1αP ( \theta \in C | y ) \ge 1 - \alpha 를 만족할 때, CC 를 자료 yy 가 주어졌을 때 θ\theta 에 대한 100(1α)%100(1 - \alpha) \% 신용구간이라고 한다.

반면 신용구간은 아예 정의부터 θ\theta 에 대한 확률로 표현된다. 그게 가능한 이유는 모수 θ\theta 에 대해 사후분포 p(θy)p ( \theta | y) 를 제대로 가정하기 때문이다. 이는 통계학을 공부하는 학생들이 개념적으로 받아들여왔던 신뢰/신용구간의 정의와 직관적으로 들어맞는다.

베이지안은 아직 얻지 않은 표본따위는 신경쓰지 않는다. 사후분포에 대한 가정, 현재까지 얻은 표본만 보고 최선의 답을 내놓은 것 뿐이다. 따라서 신용구간 100100 개를 만들었다면 그 중에 95%95 \% 정도는 모수 θ\thetaCC 에 속한다는 식의 구질구질한 설명이 필요 없다.