ユニモーダル分布の最短信頼区間 📂数理統計学

ユニモーダル分布の最短信頼区間

定理

ユニモーダル関数の定義

関数 $f : \mathbb{R} \to \mathbb{R}$ が $x \le x^{\ast}$ で減少せず、$x \ge x^{\ast}$ で増加しないようにする モード $x^{\ast}$ が存在する場合、$f$ は ユニモーダル と呼ぶ。特に、$f$ の確率密度関数がユニモーダルであれば、その確率分布を ユニモーダル分布 と呼ぶ。

最短の信頼区間

$f(x)$ をユニモーダル確率密度関数とする。区間 $[a,b]$ が次の3つの条件

(i): $\displaystyle \int_{a}^{b} f(x) dx = 1 - \alpha$
(ii): $f(a) = f(b) > 0$
(iii): $a \le x^{\ast} \le b$

を満たす場合、$[a,b]$ は $i$ を満たす全ての区間の中で最も短い。

説明

何らかの線 $y = k(\alpha)$ を引いて $f(a) = f(b)$ することで信頼区間を捉えるというのは、ベイズの最高事後密度信頼区間に似たアイデアから来ている。

証明

戦略：定理の証明自体には、実際には確率論的な概念が必ずしも必要ではなく、確率密度関数が持つ様々な性質を満たす場合、基本的な微積分学の知識で十分である。本格的な証明は背理法を使う。定理で言及されている条件 (i) を満たしながら $[a,b]$ よりも短い区間 $\left[ a’, b ' \right]$ が存在すると仮定、つまり $b’-a ' < b-a$ とすると、全ての場合で $\int_{a’}^{b’} f(x) dx < 1-\alpha$ となり、矛盾が生じる。

ケース1. $b ' \le a$

▶eq1 ◀

ケース2. $b ' > a$

もし $b \le b '$ ならば、そもそも $b’-a ' \ge b-a$ なので、$a ' \le a < b ' < b$ の場合のみ考えればよい。 $$ \begin{align*} \int_{a’}^{b’} f(x) dx \le& f \left( b ' \right) \left( b ' - a ' \right) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + R \end{align*} $$ 従って、$R := \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] < 0$ であることを示せば十分である。 $$ \begin{align*} \int_{a’}^{a} f(x) dx \le& f(a) \left( a - a ' \right) \\ \int_{b’}^{b} f(x) dx \ge& f(b) \left( b - b ' \right) \end{align*} $$ そのため、 $$ \begin{align*} R =& \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \\ \le & f(a) \left( a - a ' \right) - f(b) \left( b - b ' \right) \\ =& f(a) \left[ \left( a - a ' \right) - \left( b - b ' \right) \right] & \because f(a) = f(b) \\ =& f(a) \left[ \left( b ' - a ' \right) - \left( b - a \right) \right] \end{align*} $$ $f(a) > 0$ であり、$\left( b ' - a ' \right) < \left( b-a \right)$ と仮定したので、$R < 0$ となる。

どの場合でも $\int_{a’}^{b’} f(x) dx < 1 - \alpha$ となるので、仮定に矛盾があり、したがって条件 (i) を満たす $[a,b]$ より短い区間は存在しない。

■