logo

ユニモーダル分布の最短信頼区間 📂数理統計学

ユニモーダル分布の最短信頼区間

定理

ユニモーダル関数の定義

関数 f:RRf : \mathbb{R} \to \mathbb{R}xxx \le x^{\ast} で減少せず、xxx \ge x^{\ast} で増加しないようにする モード xx^{\ast} が存在する場合、ffユニモーダル と呼ぶ。特に、ff確率密度関数がユニモーダルであれば、その確率分布ユニモーダル分布 と呼ぶ。

最短の信頼区間

f(x)f(x) をユニモーダル確率密度関数とする。区間 [a,b][a,b] が次の3つの条件

  • (i): abf(x)dx=1α\displaystyle \int_{a}^{b} f(x) dx = 1 - \alpha
  • (ii): f(a)=f(b)>0f(a) = f(b) > 0
  • (iii): axba \le x^{\ast} \le b

を満たす場合、[a,b][a,b]ii を満たす全ての区間の中で最も短い。

説明

何らかの線 y=k(α)y = k(\alpha) を引いて f(a)=f(b)f(a) = f(b) することで信頼区間を捉えるというのは、ベイズの最高事後密度信頼区間に似たアイデアから来ている。

証明

戦略:定理の証明自体には、実際には確率論的な概念が必ずしも必要ではなく、確率密度関数が持つ様々な性質を満たす場合、基本的な微積分学の知識で十分である。本格的な証明は背理法を使う。定理で言及されている条件 (i) を満たしながら [a,b][a,b] よりも短い区間 [a,b]\left[ a’, b’ \right] が存在すると仮定、つまり ba<bab’-a’ < b-a とすると、全ての場合で abf(x)dx<1α\int_{a’}^{b’} f(x) dx < 1-\alpha となり、矛盾が生じる。


ケース1. bab’ \le a

▶eq1 ◀


ケース2. b>ab’ > a

もし bbb \le b ' ならば、そもそも babab’-a’ \ge b-a なので、aa<b<ba’ \le a < b’ < b の場合のみ考えればよい。 abf(x)dxf(b)(ba)+[aaf(x)dxbbf(x)dx]=(1α)+[aaf(x)dxbbf(x)dx]=(1α)+R \begin{align*} \int_{a’}^{b’} f(x) dx \le& f \left( b’ \right) \left( b’ - a’ \right) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + R \end{align*} 従って、R:=[aaf(x)dxbbf(x)dx]<0R := \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] < 0 であることを示せば十分である。 aaf(x)dxf(a)(aa)bbf(x)dxf(b)(bb) \begin{align*} \int_{a’}^{a} f(x) dx \le& f(a) \left( a - a’ \right) \\ \int_{b’}^{b} f(x) dx \ge& f(b) \left( b - b’ \right) \end{align*} そのため、 R=aaf(x)dxbbf(x)dxf(a)(aa)f(b)(bb)=f(a)[(aa)(bb)]f(a)=f(b)=f(a)[(ba)(ba)] \begin{align*} R =& \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \\ \le & f(a) \left( a - a’ \right) - f(b) \left( b - b’ \right) \\ =& f(a) \left[ \left( a - a’ \right) - \left( b - b’ \right) \right] & \because f(a) = f(b) \\ =& f(a) \left[ \left( b’ - a’ \right) - \left( b - a \right) \right] \end{align*} f(a)>0f(a) > 0 であり、(ba)<(ba)\left( b’ - a’ \right) < \left( b-a \right) と仮定したので、R<0R < 0 となる。


どの場合でも abf(x)dx<1α\int_{a’}^{b’} f(x) dx < 1 - \alpha となるので、仮定に矛盾があり、したがって条件 (i) を満たす [a,b][a,b] より短い区間は存在しない。