신용구간과 신뢰구간의 차이

신용구간과 신뢰구간의 차이

Credible interval vs confidence interval

요약

신용구간과 신뢰구간의 차이는 실로 베이지안과 프리퀀티스트의 차이라고 볼 수 있다.

  • 신뢰구간(프리퀀티스트): 모수는 고정된 상수고, 신뢰구간이 랜덤으로 구해진다.
  • 신용구간(베이지안): 모수도 분포를 가진 변수고, 신용구간도 사후분포로 구해진다.

신뢰구간

고전통계에서 모수 $\mu$ 에 대한 $95 \% $ 신뢰구간 $[a , b]$ 이 의미하는 것은 같은 방법으로 만들어진 신뢰구간 $100$ 개가 있다고 하면 그 중에서 $95$ 개 정도가 $\mu \in [a,b]$ 를 만족한다는 것이다. 수식으로 간단하게 표현하면 $p ( \mu \in [a,b] ) = 95 \% $ 인데, 상식과는 달리 이에 대한 해석이 무척 난해하다. 분명 같은 식이지만 이는 다음과 같이 다른 뉘앙스로 읽을 수 있다.

  1. $\mu$ 가 $[a,b]$ 에 포함될 확률이 $95 \% $ 다. (X)
  2. $[a,b]$ 가 $\mu$ 를 포함할 확률이 $95 \% $ 다. (O)

물론 위의 두 문장은 같은 말이지만, 읽는 사람은 말 그 자체가 아니라 뉘앙스의 차이를 느낄 수 있어야한다. 말하자면 $\mu$ 가 신뢰구간 $[a , b]$ 에 있을 확률이 $95 \% $ 인 것이 아니라 신뢰구간을 만드는 과정에 따르면 $n$ 개의 $95 \% $ 신뢰구간 $[a , b]$ 들 중 $\mu$ 를 포함하는 신뢰구간이 전체에서 $95 \% $ 정도 있다는 것이다.

우리가 알고 싶은 모수 $\mu$ 자체는 분포를 알 수 없는 상수고, 대신 신뢰구간의 상한과 하한인 $a,b$ 는 그 분포를 알기 때문에 $a < \mu$ 이면서 $ \mu < b$ 인 경우를 생각할 수 있는 것이다. 이 미묘한 차이 때문에 신뢰구간은 우리의 직관과 정확히 일치하지 않는다. 그래서 이렇게 상식적이고 쉬운 개념을 설명하는데에도 몇개를 만들면 그 중에 몇개는 포함하네마네 하는 지저분한 설명이 동반된다.

애초에 $\mu$ 를 기준으로 놓고 보면 $\mu$ 에 대해 어떤 분포가 정의된 적이 없기 때문에 $p ( \mu \in [a,b] )$ 이라는 표현부터가 말이 안 된다. 누가 대뜸 $X$ 의 분포도 말해주지 않고 $P \left( 0 \le X \le 2 \right)$ 의 값이 몇이냐고 물어본다면 적잖이 당황스러울텐데, 신뢰구간에 대한 잘못된 해석이 딱 이와 같다.

프리퀀티스트의 관점에서 모수 $\mu$ 는 고정된 상수로써 존재하며, 표본에 따라 달라지는 것은 신뢰구간 그 자체다. 마치 지금의 표본이 모집단과 비슷할 것이라고 가정하는 것처럼, 하나의 신뢰구간을 만들고는 이 신뢰구간이 아직 만들지 않은 나머지 신뢰구간과 비슷할 것이라고 보는 것이다.

신용구간

모수공간 $\Theta$ 의 부분집합 $C \subset \Theta$ 가 유의수준 $\alpha$ 에 대해 $P ( \theta \in C | y ) \ge 1 - \alpha$ 를 만족할 때, $C$ 를 자료 $y$ 가 주어졌을 때 $\theta$ 에 대한 $100(1 - \alpha) \% $ 신용구간이라고 한다.

반면 신용구간은 아예 정의부터 $\theta$ 에 대한 확률로 표현된다. 그게 가능한 이유는 모수 $\theta$ 에 대해 사후분포 $p ( \theta | y)$ 를 제대로 가정하기 때문이다. 이는 통계학을 공부하는 학생들이 개념적으로 받아들여왔던 신뢰/신용구간의 정의와 직관적으로 들어맞는다.

베이지안은 아직 얻지 않은 표본따위는 신경쓰지 않는다. 사후분포에 대한 가정, 현재까지 얻은 표본만 보고 최선의 답을 내놓은 것 뿐이다. 따라서 신용구간 $100$ 개를 만들었다면 그 중에 $95 \% $ 정도는 모수 $\theta$ 가 $C$ 에 속한다는 식의 구질구질한 설명이 필요 없다.

댓글