logo

유니모달 분포의 최단 신뢰구간 📂수리통계학

유니모달 분포의 최단 신뢰구간

정리

유니모달 함수의 정의

함수 f:RRf : \mathbb{R} \to \mathbb{R}xxx \le x^{\ast} 에서 감소하지 않고, xxx \ge x^{\ast} 에서 증가하지 않게끔 하는 모드mode xx^{\ast} 가 존재하면 ff유니모달unimodal하다고 한다. 특히 ff확률밀도함수가 유니모달하면 그 확률분포유니모달 분포라 부르자.

가장 짧은 신뢰구간

f(x)f(x) 가 유니모달 확률밀도함수라 하자. 구간 [a,b][a,b] 가 다음 세 조건

  • (i): abf(x)dx=1α\displaystyle \int_{a}^{b} f(x) dx = 1 - \alpha
  • (ii): f(a)=f(b)>0f(a) = f(b) > 0
  • (iii): axba \le x^{\ast} \le b

을 만족한다면, [a,b][a,b]ii 을 만족하는 모든 구간 중 가장 짧다.

설명

f(a)=f(b)f(a) = f(b) 가 되는 어떤 선 y=k(α)y = k(\alpha) 를 쳐서 신뢰구간을 잡는다는 것은 베이지안에서 말하는 최고사후밀도 신용구간과 비슷한 아이디어에서 왔다.

증명

전략: 정리의 증명 자체는 사실 꼭 확률론적인 개념이 필요하지는 않고, 확률밀도함수가 가지는 여러가지 성질을 만족하면 기초적인 미적분학 지식으로 충분하다. 본격적인 증명은 귀류법으로 한다. 정리에서 말하는 조건 (i) 을 만족 시키면서 [a,b][a,b] 보다 더 짧은 구간 [a,b]\left[ a’, b’ \right] 이 존재, 다시 말해 ba<bab’-a’ < b-a 를 가정하면 모든 경우에서 abf(x)dx<1α\int_{a’}^{b’} f(x) dx < 1-\alpha 가 되어 모순임을 보인다.


Case 1. bab’ \le a

abf(x)dxf(b)(ba)xbx    f(x)f(b)f(b)(ba)bax    f(b)f(a)<f(a)(ba)ba<ba&f(a)>0abf(x)dx(ii),(iii),x    f(x)f(a),x[a,b]=1α \begin{align*} \int_{a’}^{b’} f(x) dx \le& f \left( b’ \right) \left( b’ - a’ \right) & \because x \le b’ \le x^{\ast} \implies f(x) \le f \left( b’ \right) \\ \le& f \left( b \right) \left( b’ - a’ \right) & \because b’ \le a \le x^{\ast} \implies f \left( b’ \right) \le f \left( a \right) \\ <& f(a) (b-a) & \because b’-a’ < b-a \& f(a) > 0 \\ \le& \int_{a}^{b} f(x) dx & \because (ii), (iii), \exists x^{\ast} \implies f(x) \ge f(a) , \forall x \in [a,b] \\ =& 1 - \alpha \end{align*}


Case 2. b>ab’ > a

만약 bbb \le b ' 라면 애초에 babab’-a’ \ge b-a 이므로 aa<b<ba’ \le a < b’ < b 인 경우만 생각하면 된다. abf(x)dxf(b)(ba)+[aaf(x)dxbbf(x)dx]=(1α)+[aaf(x)dxbbf(x)dx]=(1α)+R \begin{align*} \int_{a’}^{b’} f(x) dx \le& f \left( b’ \right) \left( b’ - a’ \right) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + R \end{align*} 이므로, R:=[aaf(x)dxbbf(x)dx]<0R := \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] < 0 임을 보이면 충분하다. aaf(x)dxf(a)(aa)bbf(x)dxf(b)(bb) \begin{align*} \int_{a’}^{a} f(x) dx \le& f(a) \left( a - a’ \right) \\ \int_{b’}^{b} f(x) dx \ge& f(b) \left( b - b’ \right) \end{align*} 이므로, R=aaf(x)dxbbf(x)dxf(a)(aa)f(b)(bb)=f(a)[(aa)(bb)]f(a)=f(b)=f(a)[(ba)(ba)] \begin{align*} R =& \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \\ \le & f(a) \left( a - a’ \right) - f(b) \left( b - b’ \right) \\ =& f(a) \left[ \left( a - a’ \right) - \left( b - b’ \right) \right] & \because f(a) = f(b) \\ =& f(a) \left[ \left( b’ - a’ \right) - \left( b - a \right) \right] \end{align*} 인데 f(a)>0f(a) > 0 이고, (ba)<(ba)\left( b’ - a’ \right) < \left( b-a \right) 이라 가정했으므로 R<0R < 0 이다.


어떤 경우든 abf(x)dx<1α\int_{a’}^{b’} f(x) dx < 1 - \alpha 이므로 가정에 모순이고, 따라서 조건 (i)을 만족하는 [a,b][a,b] 보다 짧은 구간은 존재하지 않는다.