유니모달 분포의 최단 신뢰구간 📂수리통계학

유니모달 분포의 최단 신뢰구간

Shortest Confidence Interval of Unimodal Distribution

정리

유니모달 함수의 정의

함수 $f : \mathbb{R} \to \mathbb{R}$ 이 $x \le x^{\ast}$ 에서 감소하지 않고, $x \ge x^{\ast}$ 에서 증가하지 않게끔 하는 모드Mode $x^{\ast}$ 가 존재하면 $f$ 를 유니모달Unimodal하다고 한다. 특히 $f$ 의 확률밀도함수가 유니모달하면 그 확률분포유니모달 분포라 부르자.

가장 짧은 신뢰구간

$f(x)$ 가 유니모달 확률밀도함수라 하자. 구간 $[a,b]$ 가 다음 세 조건

  • (i): $\displaystyle \int_{a}^{b} f(x) dx = 1 - \alpha$
  • (ii): $f(a) = f(b) > 0$
  • (iii): $a \le x^{\ast} \le b$

을 만족한다면, $[a,b]$ 는 $i$ 을 만족하는 모든 구간 중 가장 짧다.

설명

$f(a) = f(b)$ 가 되는 어떤 선 $y = k(\alpha)$ 를 쳐서 신뢰구간을 잡는다는 것은 베이지안에서 말하는 최고사후밀도 신용구간과 비슷한 아이디어에서 왔다.

증명

전략: 정리의 증명 자체는 사실 꼭 확률론적인 개념이 필요하지는 않고, 확률밀도함수가 가지는 여러가지 성질을 만족하면 기초적인 미적분학 지식으로 충분하다. 본격적인 증명은 귀류법으로 한다. 정리에서 말하는 조건 (i) 을 만족 시키면서 $[a,b]$ 보다 더 짧은 구간 $\left[ a', b' \right]$ 이 존재, 다시 말해 $b'-a' < b-a$ 를 가정하면 모든 경우에서 $\int_{a'}^{b'} f(x) dx < 1-\alpha$ 가 되어 모순임을 보인다.


Case 1. $b' \le a$

$$ \begin{align*} \int_{a'}^{b'} f(x) dx \le& f \left( b' \right) \left( b' - a' \right) & \because x \le b' \le x^{\ast} \implies f(x) \le f \left( b' \right) \\ \le& f \left( b \right) \left( b' - a' \right) & \because b' \le a \le x^{\ast} \implies f \left( b' \right) \le f \left( a \right) \\ <& f(a) (b-a) & \because b'-a' < b-a \& f(a) > 0 \\ \le& \int_{a}^{b} f(x) dx & \because (ii), (iii), \exists x^{\ast} \implies f(x) \ge f(a) , \forall x \in [a,b] \\ =& 1 - \alpha \end{align*} $$


Case 2. $b' > a$

만약 $b \le b'$ 라면 애초에 $b'-a' \ge b-a$ 이므로 $a' \le a < b' < b$ 인 경우만 생각하면 된다. $$ \begin{align*} \int_{a'}^{b'} f(x) dx \le& f \left( b' \right) \left( b' - a' \right) + \left[ \int_{a'}^{a} f(x) dx - \int_{b'}^{b} f(x) dx \right] \\ =& (1-\alpha) + \left[ \int_{a'}^{a} f(x) dx - \int_{b'}^{b} f(x) dx \right] \\ =& (1-\alpha) + R \end{align*} $$ 이므로, $R := \left[ \int_{a'}^{a} f(x) dx - \int_{b'}^{b} f(x) dx \right] < 0$ 임을 보이면 충분하다. $$ \begin{align*} \int_{a'}^{a} f(x) dx \le& f(a) \left( a - a' \right) \\ \int_{b'}^{b} f(x) dx \ge& f(b) \left( b - b' \right) \end{align*} $$ 이므로, $$ \begin{align*} R =& \int_{a'}^{a} f(x) dx - \int_{b'}^{b} f(x) dx \\ \le & f(a) \left( a - a' \right) - f(b) \left( b - b' \right) \\ =& f(a) \left[ \left( a - a' \right) - \left( b - b' \right) \right] & \because f(a) = f(b) \\ =& f(a) \left[ \left( b' - a' \right) - \left( b - a \right) \right] \end{align*} $$ 인데 $f(a) > 0$ 이고, $\left( b' - a' \right) < \left( b-a \right)$ 이라 가정했으므로 $R < 0$ 이다.


어떤 경우든 $\int_{a'}^{b'} f(x) dx < 1 - \alpha$ 이므로 가정에 모순이고, 따라서 조건 (i)을 만족하는 $[a,b]$ 보다 짧은 구간은 존재하지 않는다.

댓글