logo

マルチンゲールの不等式たち 📂確率論

マルチンゲールの不等式たち

定理

$\left\{ (X_{n} , \mathcal{F}_{n}) \right\}$ を スーパーマルチンゲール とする。

  • [1]: 全ての $\lambda > 0$ に対して $$ \begin{align*} \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) \le & E X_{1} - \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N} dP \\ \le & E X_{1} + E X_{N}^{-} \text{ a.s.} \end{align*} $$
  • [2]: 全ての $\lambda > 0$ に対して $$ \begin{align*} \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) \le & - \int_{(\min_{n \le N} X_{n} \le - \lambda)} X_{N} dP \\ \le & E X_{N}^{-} \text{ a.s.} \end{align*} $$

$\left\{ (X_{n} , \mathcal{F}_{n}) \right\}$ を サブマルチンゲール とする。

  • [3]: 全ての $\lambda > 0$ に対して $$ \begin{align*} \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) \le & \int_{(\max_{n \le N} X_{n} \ge \lambda)} X_{N} dP \\ \le & E \left| X_{N} \right| \text{ a.s.} \end{align*} $$
  • [4]: 全ての $\lambda > 0$ に対して $$ \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) \le E X_{n}^{+} - E X_{1} \text{ a.s.} $$

$\left\{ (X_{n} , \mathcal{F}_{n}) \right\}$ を マルチンゲール とする。

  • [5]: 全ての $\lambda > 0$ に対して $$ P \left( \max_{n \le N} | X_{n} | \ge \lambda \right) \le {{1} \over {\lambda^{p}}} E |X_{N}|^{p} \text{ a.s.} $$

説明

ここで紹介された不等式は$\lambda$ で両辺を割って確率のバウンドを指定するのに同様に使うことができる。特に、マルチンゲールはスーパーマルチンゲールであり、サブマルチンゲールでもあるため、上記の全ての不等式を利用することができる。

  • [3]: マルコフ不等式 により $\displaystyle P(\max_{n \le N} X_{n} \ge \lambda ) \le {{ 1 } \over { \lambda }} E \left| \max_{n \le N} X_{n} \right|$ は既に知っているが、サブマルチンゲールという条件―情報が追加されたことにより、$N$ だけを見てバウンドをより減らしたものと見ることができる、$\displaystyle P(\max_{n \le N} X_{n} \ge \lambda ) \le {{ 1 } \over { \lambda }} E \left| X_{N} \right|$ のように。
  • [4]: サブマルチンゲール―スーパーマルチンゲールという条件の対比とともに [1] とは対をなすと見ることができる。
  • [5]: この式は一般化された マルコフ不等式 $\displaystyle P(|X|^{p} \ge C^{p}) \le {{ 1 } \over { C^{p} }} E | X |^{p}$ と同様に、$\lambda>1$ が与えられた場合 $p$ を増やすほど確率のバウンドを減らすことができるが、その前に $X_{N}$ の $p$ 次モーメントが存在する必要があることを忘れてはいけない。

証明

戦略 [1], [2]: バウンドされた $N$ を考えて以下の定理から不等式で出発する。

任意サンプリング定理: $\left\{ ( X_{n} , \mathcal{F}_{n} ) \right\}$ が スーパーマルチンゲール であり、$\tau$ と $\sigma$ が $\sigma \le \tau$ であり $\mathcal{F}_{n}$ に対してバウンドされた停止時間であれば $$ E \left( X_{\tau} | \mathcal{F}_{\sigma} \right) \le X_{\sigma} \text{ a.s.} $$

証明過程で定義される$T$は、$X_{n}$が初めて$\lambda$を超える瞬間であり、その回数が$N$を超える場合は諦めてただちに$N$を取ると考える。これを理解することが肝心で、これを基準にして積分領域を分割するトリックを使う

[1]

パート 1. 停止時間 $T$ の定義

確率変数 $ T:= \begin{cases} \inf \left\{ n \le N: X_{n} \ge \lambda \right\} &, n < N \\ N &, \text{otherwise} \end{cases}$ を定義する。今、全ての $k \in \mathbb{N}$に対して $(T = k) \in \mathcal{F}_{k}$ であるか確認して$T$が停止時間であることを示そう。まず $k = n < N$ に対しては $$ (T = n) = \left( X_{1} < \lambda , \cdots , X_{n-1} < \lambda, X_{n} \ge \lambda \right) \in \mathcal{F}_{n} $$ であり、$k = N$ に対しては $k = N-1$番目まで $X_{k} < \lambda$ であるか確認すればいいので $$ (T = N) = \left( X_{1} < \lambda , \cdots , X_{n-1} < \lambda \right) \in \mathcal{F}_{N-1} \subset \mathcal{F}_{N} $$


パート 2.

任意サンプリング定理によれば、ほぼ確実に $E \left( X_{T} | \mathcal{F}_{1} \right) \le X_{1}$ であるため $$ \begin{align*} \int_{\Omega} X_{1} dP \ge& \int_{\Omega} E \left( X_{T} | \mathcal{F}_{1} \right) dP \\ =& \int_{\Omega} X_{T} dP \\ =& \int_{(\max_{n \le N} X_{n} \ge \lambda)} X_{T} dP + \int_{(\max_{n \le N} X_{n} < \lambda)} X_{T} dP\text{ a.s.} \end{align*} $$ 上記の展開から最後の行は積分領域を$(\max_{n \le N} X_{n} \ge \lambda)$ と $(\max_{n \le N} X_{n} < \lambda)$ に分けたものである。すると$T$ の定義により $(\max_{n \le N} X_{n} \ge \lambda)$ 上では$X_{T} \ge \lambda$ であり $(\max_{n \le N} X_{n} < \lambda)$ 上では$X_{T} = X_{N}$ であるため $$ \begin{align*} \int_{\Omega} X_{1} dP \ge& \int_{(\max_{n \le N} X_{n} \ge \lambda)} X_{T} dP + \int_{(\max_{n \le N} X_{n} < \lambda)} X_{T} dP \\ =& \int_{(\max_{n \le N} X_{n} \ge \lambda)} \lambda dP + \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N} dP \\ =& \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) + \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N} dP \text{ a.s.} \end{align*} $$


パート 3.

項を整理すると $$ \begin{align*} \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) \le & & \int_{\Omega} X_{1} dP - \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N} dP \\ =& E X_{1} - \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N}^{+} dP + \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N}^{-} dP \text{ a.s.} \end{align*} $$ ここで$X_{N}^{+} \ge 0$ であるため$\displaystyle - \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N}^{+} dP$ を除外して $$ \int_{(\max_{n \le N} X_{n} < \lambda)} X_{N}^{-} dP \le \int_{\Omega} X_{N}^{-} dP = E X_{N}^{-} $$ したがって $$ \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) \le E X_{1} + E X_{N}^{-} \text{ a.s.} $$

[2]

パート 1. 停止時間 $T$ の定義

確率変数 $ T:= \begin{cases} \inf \left\{ n \le N: X_{n} \le - \lambda \right\} &, n < N \\ N &, \text{otherwise} \end{cases}$ を定義する。今、全ての $k \in \mathbb{N}$に対して $(T = k) \in \mathcal{F}_{k}$ であるか確認して$T$が停止時間であることを示そう。まず $k = n < N$ に対しては $$ (T = n) = \left( X_{1} > - \lambda , \cdots , X_{n-1} > - \lambda, X_{n} \le - \lambda \right) \in \mathcal{F}_{n} $$ であり、$k = N$ に対しては $k = N-1$番目まで $X_{k} > - \lambda$ であるか確認すればいいので $$ (T = N) = \left( X_{1} > - \lambda , \cdots , X_{n-1} > - \lambda \right) \in \mathcal{F}_{N-1} \subset \mathcal{F}_{N} $$ であり、$T \le N$ が成り立つ。


パート 2.

条件付き期待値の性質: すべてのシグマ場 $\mathcal{G}$ に対して、$E \left[ E ( X | \mathcal{G} ) \right] = E(X)$

任意サンプリング定理によれば、ほぼ確実に $E \left( X_{N} | \mathcal{F}_{T} \right) \le X_{n}$ であり、両辺に期待値 $E$ を取ることで証明 [1] のパート 2. と同様に $$ \begin{align*} E X_{N} \le & E X_{T} \\ =& \int_{\Omega} X_{T} dP \\ =& \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{T} dP + \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{T} dP \\ \le & - \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right)+ \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{N} dP \end{align*} $$ しかし$\displaystyle E X_{N} = \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N} dP + \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{N} dP$ なので $$ \begin{align*} & \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N} dP + \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{N} dP \\ \le & - \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right)+ \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{N} dP \end{align*} $$ 両辺から $\displaystyle \int_{(\min_{n \le N} X_{n} > - \lambda )} X_{N} dP$ を取り除けば $$ \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N} dP \le - \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) $$


パート 3.

符号を反転させると $$ \begin{align*} \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) \le & - \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N} dP \\ =& - \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N}^{+} dP + \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N}^{-} dP \end{align*} $$ 証明 [1] のパート 3と同様に $X_{N}^{+} \ge 0$ であるため$\displaystyle - \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N}^{+} dP$ を除外して $$ \int_{(\min_{n \le N} X_{n} \le - \lambda )} X_{N}^{-} dP \le \int_{\Omega} X_{N}^{-} dP = E X_{N}^{-} $$ したがって $$ \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) \le E X_{N}^{-} \text{ a.s.} $$

[3]

$$ \begin{align*} \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) =& \lambda P \left( - \max_{n \le N} X_{n} \le - \lambda \right) \\ =& \lambda P \left( \min_{n \le N} (-X_{n}) \le - \lambda \right) \end{align*} $$ $\left\{ \left( -X_{n} , \mathcal{F}_{n} \right) \right\}$ はスーパーマルチンゲールであるため、[2] に従って $$ \begin{align*} \lambda P \left( \min_{n \le N} (-X_{n}) \le - \lambda \right) \le & - \int_{(\min_{n \le N} X_{n} \le - \lambda)} (-X_{N}) dP \\ \le & \int_{(\max_{n \le N} X_{n} \ge \lambda)} X_{N} dP \\ \le & \int_{(X_{N} \ge 0)} X_{N} dP \\ \le & E X_{N}^{+} \\ \le & E \left| X_{N} \right| \text{ a.s.} \end{align*} $$

[4]

$\left\{ \left( -X_{n} , \mathcal{F}_{n} \right) \right\}$ はスーパーマルチンゲールであるため、[1] に従って $$ \begin{align*} \lambda P \left( \min_{n \le N} X_{n} \le - \lambda \right) =& \lambda P \left( \max_{n \le N} \left( -X_{n} \right) \ge \lambda \right) \\ \le & E \left( -X_{1} \right) + E \left( -X_{N} \right)^{-} \\ =& E \left( -X_{N} \right)^{-} - E X_{1} \\ =& E \left( -X_{N}^{+} + X_{N}^{-} \right)^{-} - E X_{1} \\ =& E \left( X_{N} \right)^{+} - E X_{1} \text{ a.s.} \end{align*} $$

[5]

条件付きイェンセン不等式帰結 に従って、$\left\{ \left( |X_{n}|^{p} , \mathcal{F}_{n} \right) \right\}$ はサブマルチンゲールであるため、[3] に従って $$ \begin{align*} & \lambda^{p} P \left( \max_{n \le N} | X_{n} |^{p} \ge \lambda^{p} \right) \le E \left| X_{N} \right|^{p} \text{ a.s.} \\ \iff & P \left( \max_{n \le N} | X_{n} |^{p} \ge \lambda^{p} \right) \le {{ 1 } \over { \lambda^{p} }} E \left| X_{N} \right|^{p} \text{ a.s.} \\ \iff & P \left( \max_{n \le N} | X_{n} | \ge \lambda \right) \le {{ 1 } \over { \lambda^{p} }} E \left| X_{N} \right|^{p} \text{ a.s.} \end{align*} $$