測度の弱収束
定義
空間 $S$ が距離空間 $( S , \rho)$ であり、かつ可測空間 $(S,\mathcal{B}(S))$ であるとする。
測度論
$S$ 上で定義される測度 $\mu$ とその測度の列 $\left\{ \mu_n \right\}_{n \in \mathbb{N}}$ が $n \to \infty$ のとき、全ての $f \in C_{b}(S)$ に対して以下を満たすとき、$\left\{ \mu_{n} \right\}$ が測度 $\mu$ に弱く収束するconverge Weaklyと言い、$\mu_{n}\overset{W}{\to}\mu$ のように表される。 $$ \int_{S} f d\mu_{n} \to \int_{S} f d\mu $$
確率論
$S$ 上で定義される確率 $P$ と確率の列 $\left\{ P_n \right\}_{n \in \mathbb{N}}$ が $n \to \infty$ のとき、全ての $f \in C_{b}(S)$ に対して以下を満たすとき、$\left\{ P_{n} \right\}$ が確率 $P$ に弱く収束するconverge Weaklyと言い、$P_{n}\overset{W}{\to}P$ のように表される。 $$ \int_{S} f dP_{n} \to \int_{S} f dP $$
- $C_{b}(S)$ は $S$ で定義される有界連続関数の集まりを以下のように表す。 $$ C_{b}(S) := \left\{ f:S \to \mathbb{R} \mid f\text{ is bounded and continuous} \right\} $$
- $\displaystyle \int_{S} f dP$ は簡単に $\displaystyle Pf := \int_{S} f dP$ のように表されることもある。
説明
測度の弱収束に関する代表的な応用は、確率論を挙げることができる。本ポストでは、主に統計学のバックグラウンドを持つ人が確率論に触れることを想定し、位相数学に不慣れな読者向けに説明した。バックグラウンドが数学であれば、位相数学の内容は気軽に読んで、確率論で何が必要かを探る感じで読めばいい。
統計学
確率(測度)の弱収束とは、測度論で説明される分布収束と見なすことができる。数理統計学などで接する分布収束では、単変量確率変数の場合、$X_{n}$ の累積分布関数 $F_{X_{n}}$ が存在して、$X$ の累積分布関数 $F_{X}$ が連続となる全ての点 $x \in X$ において以下を満たす場合、$X_{n} \overset{D}{\to} X$ とされた。 $$ \lim_{n\to\infty} F_{X_{n}}(x) = F(x) $$ 全ての $f \in C_{b}(S)$ に対して以下を満たす場合、弱収束するとされているが、上下の二つの式が似ていることに注目しよう。 $$ \lim_{n\to\infty} P_{n} f = P f $$ 確率(測度)の列を難しく考えることなく、まずは直感的に接近しよう。式を見ると、$f$ が $P_{n}$ の重みを持って$P f$ に収束すると見ることができる。確率論で扱う関数とは、結局確率変数なのだが、これを $X_{n}\equiv P_{n}f$、$X \equiv Pf$ のように表せば、以下のように表せるかもしれない。 $$ X_{n} \overset{D}{\to}X \overset{?}{\iff} P_{n} \overset{W}{\to} P $$ 左の式で見えないものは、$X$ が連続となる全ての点 $x \in S$ であり、右の式で見えないものは、有界連続の全ての関数 $f \in C_{b}(S)$ だ。
位相数学
弱収束について論じる上で、基本的な位相数学を必ず把握していなければならない。幸いにして、測度論で論じられる空間はかなり直感的で、距離空間くらいは知っていれば十分だ。空間 $S$ が距離空間 $( S , \rho)$ であり、かつ $(S,\mathcal{B}(S))$ が可測空間であるということは、$S$ で全ての $x \in S$ と全ての $\varepsilon>0$ に対して距離関数 $\rho$ で作られる全てのオープンボール $B_{\rho}(x , \varepsilon) := \left\{ y \in S : \rho (x,y) < \varepsilon \right\}$ を含む最小のシグマフィールド、つまりボレルシグマフィールド $\mathcal{B}(S)$ をシグマフィールドとして持つ可測空間 $(S,\mathcal{B}(S))$ となるということだ。
オープンセットはオープンボールの合集であり、シグマフィールドの性質により、その補集合も全て$\mathcal{B}(S)$に含まれるので、全てのクローズドセットも$\mathcal{B}(S)$に属する必要がある。単純な例として、$S=\mathbb{R}$ を考えてみよう。$\mathcal{B}(\mathbb{R})$ は以下のような開集合と閉集合を要素として持つ。 $$ \emptyset, \mathbb{R}, [0,7], (-\infty, \pi) , \left\{ 1 \right\}, (-1,1) \cap (0,9) $$ それだけでなく、シグマフィールドの他の条件により、以下のように開集合と閉集合が混在する集合も要素として持つ。ここで例に挙げた集合が比較的直感的に作られていると感じることができれば良い。 $$ [0,1), (-\infty,\pi], [\pi , \infty) , \left\{ 1 \right\} \cup (-3,-2) $$ まだ難しく感じ、定義を納得できない場合は、時間をかけてでも位相数学を勉強してみることをお勧めする。もちろん、確率論を勉強しようとして最初に位相数学の基礎を固めるのは非効率的かもしれない。しかし、効率を求めるのではなく、その経験自体が大きな助けになる。位相数学には非常に衝撃的で変態的な例がたくさんある。抽象数学の辛さを味わえば、距離空間のような良い空間を勉強することに感謝の気持ちを持つようになるだろう。もちろん、数学的なセンスも同時に鍛えることができる。
このトピックに関して、次の有用な定理を紹介する。
定理
$P$ が $(S,\mathcal{B}(S))$ で定義された確率だとしよう。すると、全ての $A \in \mathcal{B}(S)$ と $\varepsilon>0$ に対して以下を満たす閉集合 $F_{\varepsilon}$ と開集合 $G_{\varepsilon}$ が存在する。 $$ F_{\varepsilon}\subset A \subset G_{\varepsilon} \\ P ( G_{\varepsilon} \setminus F_{\varepsilon}) < \varepsilon $$ 上の定理に基づいて、次の系を得ることができる。 $$ \begin{align*} P(A) =& \sup \left\{ P(F) : F \in \mathcal{B}(S) \text{ is closed in S} \right\} \\ =& \inf \left\{ P(G) : G \in \mathcal{B}(S) \text{ is open in S} \right\} \end{align*} $$
言うまでもなく、どのような位相空間でも元々$A^{\circ} \subset A \subset \overline{A}$であったため、$A$よりも少し小さいオープンセット、少し大きいクローズドセットの存在は断言できるが、上のように$P ( G_{\varepsilon} \setminus F_{\varepsilon}) < \varepsilon$を満たしながら、少し小さいクローズドセットと少し大きいオープンセットが存在することは、思うほど当たり前ではない。これは、確率$P$が測度であり、連続であるという点を明確にした後に当たり前になる。
実際、百マイル以上語るよりも、上の画像を見て理解する方が簡単だろう。この性質により、$A$の境界 $\partial A$ の周りをぎりぎりで通りながら、$\varepsilon > 0$が与えられるたびに十分に狭い帯を見つけることができる$F_{\varepsilon}$と$G_{\varepsilon}$が存在することになる。