ユニモーダル分布の最短信頼区間
定理
ユニモーダル関数の定義
関数 $f : \mathbb{R} \to \mathbb{R}$ が $x \le x^{\ast}$ で減少せず、$x \ge x^{\ast}$ で増加しないようにする モード $x^{\ast}$ が存在する場合、$f$ は ユニモーダル と呼ぶ。特に、$f$ の確率密度関数がユニモーダルであれば、その確率分布を ユニモーダル分布 と呼ぶ。
最短の信頼区間
$f(x)$ をユニモーダル確率密度関数とする。区間 $[a,b]$ が次の3つの条件
- (i): $\displaystyle \int_{a}^{b} f(x) dx = 1 - \alpha$
- (ii): $f(a) = f(b) > 0$
- (iii): $a \le x^{\ast} \le b$
を満たす場合、$[a,b]$ は $i$ を満たす全ての区間の中で最も短い。
説明
何らかの線 $y = k(\alpha)$ を引いて $f(a) = f(b)$ することで信頼区間を捉えるというのは、ベイズの最高事後密度信頼区間に似たアイデアから来ている。
証明
戦略:定理の証明自体には、実際には確率論的な概念が必ずしも必要ではなく、確率密度関数が持つ様々な性質を満たす場合、基本的な微積分学の知識で十分である。本格的な証明は背理法を使う。定理で言及されている条件 (i) を満たしながら $[a,b]$ よりも短い区間 $\left[ a’, b’ \right]$ が存在すると仮定、つまり $b’-a’ < b-a$ とすると、全ての場合で $\int_{a’}^{b’} f(x) dx < 1-\alpha$ となり、矛盾が生じる。
ケース1. $b’ \le a$
▶eq1 ◀
ケース2. $b’ > a$
もし $b \le b '$ ならば、そもそも $b’-a’ \ge b-a$ なので、$a’ \le a < b’ < b$ の場合のみ考えればよい。 $$ \begin{align*} \int_{a’}^{b’} f(x) dx \le& f \left( b’ \right) \left( b’ - a’ \right) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] \\ =& (1-\alpha) + R \end{align*} $$ 従って、$R := \left[ \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \right] < 0$ であることを示せば十分である。 $$ \begin{align*} \int_{a’}^{a} f(x) dx \le& f(a) \left( a - a’ \right) \\ \int_{b’}^{b} f(x) dx \ge& f(b) \left( b - b’ \right) \end{align*} $$ そのため、 $$ \begin{align*} R =& \int_{a’}^{a} f(x) dx - \int_{b’}^{b} f(x) dx \\ \le & f(a) \left( a - a’ \right) - f(b) \left( b - b’ \right) \\ =& f(a) \left[ \left( a - a’ \right) - \left( b - b’ \right) \right] & \because f(a) = f(b) \\ =& f(a) \left[ \left( b’ - a’ \right) - \left( b - a \right) \right] \end{align*} $$ $f(a) > 0$ であり、$\left( b’ - a’ \right) < \left( b-a \right)$ と仮定したので、$R < 0$ となる。
どの場合でも $\int_{a’}^{b’} f(x) dx < 1 - \alpha$ となるので、仮定に矛盾があり、したがって条件 (i) を満たす $[a,b]$ より短い区間は存在しない。
■