測度論によって定義される分布の収束
定義
距離空間 $S$ の ボレルシグマ場 $\mathcal{S}:= \mathcal{B}(S)$ に関して 可測空間 $(S,\mathcal{S})$ を定義しよう。
確率空間 $(\Omega, \mathcal{F}, P)$ で定義された 確率変数 $X$ と 確率過程 $\left\{ X_{n} \right\}_{n \in \mathbb{N}}$ が $n \to \infty$ のとき、すべての $f \in C_{b}(S)$ に対して以下を満たす場合、$X$ は分布収束するconverge in distributionと言い、$X_{n} \overset{D}{\to} X$ と示される。 $$ \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP $$
- $C_{b}(S)$ は、$S$ で定義される有界連続関数の集合を表す。 $$ C_{b}(S) := \left\{ f:S \to \mathbb{R} \mid f\text{ is bounded and continuous} \right\} $$
定理
- [1]: $(S,\mathcal{S})$ で定義された 確率測度の 列 $\left\{ P_{n} \right\}_{n \in \mathbb{N}}$ がすべての ボレル集合 $B \in \mathcal{B} \left( \mathbb{R} \right)$ に対して $$ P_{n} \left( X^{-1} (B) \right) := P \left( X_{n}^{-1} (B) \right) $$ を満たすように定義されている場合、次のことが成立する。 $$ X_{n} \overset{D}{\to} X \iff P_{n} \overset{W}{\to} P $$
- 2: $X_{n} \overset{D}{\to} X$ と、すべての $\left\{ X_{n} \right\}$ のサブシーケンス $\left\{ X_{n '} \right\} \subset \left\{ X_{n} \right\}$ が $X_{n ''} \overset{D}{\to} X$ を満たす $\left\{ X_{n '} \right\}$ のサブシーケンス $\left\{ X_{n ''} \right\} \subset \left\{ X_{n '} \right\}$ を持つことは同値である。数式で再び書くと、次のようになる。 $$ X_{n} \overset{D}{\to} X \iff \forall \left\{ X_{n '} \right\} \subset \left\{ X_{n} \right\}, \exists \left\{ X_{n ''} \right\} \subset \left\{ X_{n '} \right\} : X_{n ''} \overset{D}{\to} X $$
- [3] 連続写像定理: 可測関数 $h : (S , \mathcal{S}) \to (S ' , \mathcal{S} ')$ について、$h$ が連続である点の集合 $C_{h}$、言い換えると $C_{h} : = \left\{ x \in S : h \text{ is continuous at } x \right\}$ を定義しよう。もし$X_{n} \overset{D}{\to} X$ かつ $P(X \in C_{h}) = 1$ なら $h(X_{n}) \overset{D}{\to} h(X)$ である。数式で示すと、次のようになる。 $$ X_{n} \overset{D}{\to} X \land P(X \in C_{h}) = 1 \implies h(X_{n}) \overset{D}{\to} h(X) $$
説明
- [1]: 定理で紹介したように、このように定義された $P_{n}$ は誘導された確率測度induced Probability measureと呼ばれる。確率 ‘変数’の収束と、$P_{n} \overset{W}{\to} P$ すなわち確率 ‘測度’の収束と区別されることが重要である。
- [3]: 連続写像定理は、実際には確率収束やほぼ確実に収束に対しても一般化可能である。$h$ も関数であり、確率変数も関数である点から、合成関数 $h \circ X$ の使用が自然に考えられるべきである。$A \in \mathcal{S} ' $ に対して、次の式が意味を成すかどうかを考え、納得する過程が必要である。 $$ P \left( h(X)^{-1} (A) \right) = P \left( X \in h^{-1}(A) \right) $$ すべての $f \in C_{b}(S)$ において分布が同じであるという表記は $\overset{D}{=}$ を使うこともある。その定義は、すべての $A \in \mathcal{S} ' $ と連続関数 $h:S \to S'$ に対して次のようである。 $$ h(X) \overset{D}{=} h(Y) \overset{\text{def}}{\iff} P \left( h(X)^{-1}(A) \right) = P \left( h(Y)^{-1}(A) \right) $$ 再び収束の表現を考えると、次のようになる。 $$ h\left( X_{n} \right) \overset{D}{\to} h(X) \iff P \left( h\left( X_{n} \right)^{-1}(A) \right) \to P \left( h(X)^{-1}(A) \right) $$
証明
[1]
すべての $f \in C_{b}(S)$ に対して $$ \begin{align*} P_{n} \overset{W}{\to} P \iff & \int_{S} f dP_{n} \to \int_{S} f dP \\ \iff & \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP \\ \iff & X_{n} \overset{D}{\to} X \end{align*} $$
■
2
$(\implies)$ $X_{n} \overset{D}{\to} X$ が成立しない場合 $$ \int_{\Omega} f(X_{n}) dP \to \int_{\Omega} f(X) dP $$ $f \in C_{b}(S)$ が存在すると仮定する。つまり、 $$ \left| \int_{\Omega} f(X_{n '}) dP - \int_{\Omega} f(X) dP \right| > \varepsilon $$ を満たす $\varepsilon > 0$ とサブシーケンスのインデックス $\left\{ n' \right\}$ が存在すると仮定するのだ。しかし、これは $$ \int_{\Omega} f(X_{n ''}) dP \to \int_{\Omega} f(X) dP $$ を満たすサブシーケンスのインデックスのサブシーケンス $\left\{ n'' \right\}$ が常に存在するため矛盾である。
$(\impliedby)$ $\left\{ n'' \right\} = \left\{ n \right\}$ とすると、自明に成立する。
■
[3]
$P_{X}$ を $X$ から誘導された確率測度、すなわち $P_{X}(A) := P \left( X^{-1}(A) \right) = P(X \in A)$ としよう。 $$ \overline{h^{-1}(B)} \subset h^{-1}(B) \cup C_{h}^{c} $$ $S'$ のすべての閉集合 $B$ に対して、上記の包含関係が成立する。任意の $x \in \overline{h^{-1}(B)}$ を考えると、$h$ が連続部分に対して閉包を保持して $h^{-1}(B)$ を含み、連続でない部分の逆像は $C_{h}^{c}$ を含むからである。閉包 $\overline{h^{-1}(B)}$ は $S$ で閉集合であるので $$ \begin{align*} & \limsup_{n \to \infty} P \left( h ( X_{n} ) \in B \right) \\ =& \limsup_{n \to \infty} P \left( X_{n} \in h^{-1} (B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( \left[ X_{n}^{-1} \circ h^{-1} \right] (B) \right) \\ =& \limsup_{n \to \infty} P_{X} \left( X_{n}^{-1} \left( h^{-1} (B) \right) \right) \\ =& \limsup_{n \to \infty} P_{n} \left( h^{-1} (B)\right) \\ \le & \limsup_{n \to \infty} P_{n} \left( \overline{h^{-1} (B)} \right) \end{align*} $$
ポートマントー定理: 空間 $S$ が 距離空間 $( S , \rho)$ でありながら 可測空間 $(S,\mathcal{B}(S))$ でもあるとしよう。次のすべては同値である。
- (1): $P_{n} \overset{W}{\to} P$
- (2): すべての有界な、一様連続関数 $f$ に対して $\displaystyle \int_{S} f dP_{n} \to \int_{S}f d P$
- (3): すべての閉集合 $F$ に対して $\displaystyle \limsup_{n\to\infty} P_{n}(F) \le P(F)$
- (4): すべての開集合 $G$ に対して $\displaystyle P(G) \le \liminf_{n\to\infty} P_{n}(G)$
- (5): $P(\partial A) = 0$ であるすべての $A$ に対して $\displaystyle \lim_{n\to\infty} P_{n}(A) = P(A)$
[1]に従って $X_{n} \overset{D}{\to} X$ であれば $P_{n} \overset{W}{\to} P_{X}$ であり、ポートマントー定理の $(1) \implies (3)$ と仮定 $P_{X}(X \in C_{h}^{c}) = 0$ によって $$ \begin{align*} \limsup_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) \le & \limsup_{n \to \infty} P_{n} \left( \overline{h^{-1} (B)} \right) \\ \le & P_{X} \left( \overline{h^{-1} (B)} \right) \\ \le & P_{X} \left( h^{-1} (B) \cup C_{h}^{c} \right) \\ \le & P _{X}\left( h^{-1} (B) \right) + P_{X} \left( C_{h}^{c} \right) \\ \le & P_{X} \left( h^{-1} (B) \right) \\ \le & P_{X} \left( X^{-1} \left( h^{-1} (B) \right) \right) \\ \le & P_{X} \left( \left( h(X) \right)^{-1} (B) \right) \end{align*} $$ 同じ方法で $\displaystyle P_{X} \left( \left( h(X) \right)^{-1} (B) \right) \le \liminf_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right)$ を示せば $$ \lim_{n \to \infty} P_{X} \left( h ( X_{n} )^{-1}(B) \right) = P_{X} \left( \left( h(X) \right)^{-1} (B) \right) $$
■
参考文献
- 数理統計学で定義された分布収束
- ほとんど確実に収束 $\implies$ 確率収束 $\implies$, 分布収束(弱収束)
更新情報
- 2023年8月19日、リュデシクによる、定理 [1] ステートメントの誤字修正($P_{n} (A) := P \left( X_{n}^{-1} (A)\right)$ → $P_{n} \left( X^{-1} (B) \right) := P \left( X_{n}^{-1} (B)\right)$)