logo

측도론과 확률론 요약 정리 📂確率論

측도론과 확률론 요약 정리

概要

測度論と確率論を学んだ人向けの定義と概念の要約資料です。迅速な復習と定義の参照のために作成されました。

測度論

代数

$X \ne \varnothing$の部分集合たちのコレクション $\mathcal{A}$が 有限 合集合と補集合に対して閉じている時、これを代数と言います。

可算合集合に対して閉じている代数を$\sigma$-代数と言います。

Note:

  • 定義により $\mathcal{A}$はまた交集合に対しても閉じています $\big( \because E_{1} \cap E_{2} = \left( E_{1} \cup E_{2} \right)^{c} \in \mathcal{A}$ for $E_{1}, E_{2} \in \mathcal{A} \big)$
  • $\mathcal{A}$は空集合 $\varnothing$と全集合 $X$を含みます。 $\big( \because E \in \mathcal{A}$ $\implies$ $\varnothing = E \cap E^{c} \in \mathcal{A} \text{ and } X = E \cup E^{c} \in \mathcal{A} \big)$

$X$が位相空間なら、$X$の開集合たちのコレクションから作られる$\sigma$-代数を$X$上のボレル $\sigma$-代数と言い、$\mathcal{B}_{X}$と表記します。

  • ボレル $\sigma$-代数は全ての開集合を含む最も小さい唯一の$\sigma$-代数です。

$\mathcal{E}$を$X$上の$\sigma$-代数としましょう。順序対 $(X, \mathcal{E})$を可測空間と言い、$E \in \mathcal{E}$を可測集合と言います。

特に言及がない限り、以下では固定された可測空間 $(X, \mathcal{E})$について扱います。

可測関数

全ての実数 $\alpha \in \mathbb{R}$に対して、次を満たす関数 $f : X \to \mathbb{R}$を($\mathcal{E}$-)可測と言います。 $$ \left\{ x \in X : f(x) \gt \alpha \right\} \in \mathcal{E}\qquad \forall \alpha \in \mathbb{R}. $$

一般化

$(X, \mathcal{E})$、$(Y, \mathcal{F})$を可測空間とします。関数 $f : X \to Y$が次を満たす時、これを$(\mathcal{E}, \mathcal{F})$-可測と言います。 $$ f^{-1}(F) = \left\{ x \in X : f(x) \in F \right\} \in \mathcal{E}\qquad \forall F \in \mathcal{F}. $$

Note: $\mathcal{E}$-可測関数は上の定義で$(Y, \mathcal{F}) = (\mathbb{R}, \mathcal{B}_{\mathbb{R}})$の場合と同じです。

測度

$\mathcal{E}$ (または $(X, \mathcal{E})$、$X$)上の測度とは、次を満たす関数 $\mu : \mathcal{E} \to [0, \infty]$です。

  • Null empty set: $\mu (\varnothing) = 0$。
  • Countable additivity: $\left\{ E_{j} \right\}$が$\mathcal{E}$の互いに素な集合たちなら、$\displaystyle \mu \left( \bigcup\limits_{j} E_{j} \right) = \sum\limits_{j} \mu (E_{j})$。

三つ組 $(X, \mathcal{E}, \mu)$を測度空間と言います。特に言及がない限り以下では固定された測度空間 $(X, \mathcal{E}, \mu)$について扱います。

ボレル測度とは、定義域がボレル $\sigma$-代数$\mathcal{B}_{\mathbb{R}}$の測度を言います: $$ \mu : \mathcal{B}_{\mathbb{R}} \to [0, \infty] $$

$(X, \mathcal{E})$、$(Y, \mathcal{F})$上の二つの測度 $\mu$、$\nu$に対して、次を満たす$\mathcal{E} \times \mathcal{F}$上の唯一の測度 $\mu \times \nu$を$\mu$と$\nu$の積測度と言います。 $$ \mu \times \nu (E \times F) = \mu (E) \nu (F)\qquad \text{ for all rectangles } E \times F. $$

積分

実関数 $f$が有限な関数値を持つ時、これを単純と言います。

単純可測関数 $\varphi$は次のような形で表されます。 $$ \begin{equation} \varphi = \sum\limits_{j=1}^{n} a_{j}\chi_{E_{j}}, \text{ where } E_{j} = \varphi^{-1}(\left\{ a_{j} \right\}) \text{ and } \operatorname{range} (\varphi) = \left\{ a_{1}, \dots, a_{n} \right\}. \end{equation} $$ ここで $\chi_{E_{j}}$は$E_{j}$の特性関数です。これを$\varphi$のstandard representationと言います。

$\varphi$がstandard representation $(1)$を持つ単純可測関数の時、測度 $\mu$に対する**$\varphi$の積分**を次のように定義します。 $$ \int \varphi d\mu := \sum\limits_{j=1}^{n} a_{j}\mu (E_{j}). $$ Notation: $$ \int \varphi d\mu = \int \varphi = \int \varphi(x) d\mu (x), \qquad \int = \int_{X}. $$

$f$が$(X, \mathcal{E})$上の可測関数の時、$\mu$に対する**$f$の積分**を次のように定義します。 $$ \int f d\mu := \sup \left\{ \int \varphi d\mu : 0 \le \varphi \le f, \varphi \text{ is simple and measurable} \right\}. $$

$f : X \to \mathbb{R}$の正の部分負の部分をそれぞれ次のように定義します。 $$ f^{+}(x) := \max \left( f(x), 0 \right)),\qquad f^{-1}(x) := \min \left(-f(x), 0 \right)). $$ もし二つの積分$\displaystyle \int f^{+}$、$\displaystyle \int f^{-}$が有限なら、$f$が積分可能と言います。また$\left| f \right| = f^{+} - f^{-}$が成立します。

積分可能な実関数たちの集合はベクトル空間であり、積分はこのベクトル空間上の線形汎関数です。このベクトル空間を次のように表記します。 $$ L = L(X, \mathcal{E}, \mu) = L(X, \mu) = L(X) = L(\mu), \qquad L = L^{1} $$

$L^{p}$空間

測度空間$(X, \mathcal{E}, \mu)$と$0 \lt p \lt \infty$に対して、$L^{p}$を次のように定義します。 $$ L^{p}(X, \mathcal{E}, \mu) := \left\{ f : X \to \mathbb{R} \left| f \text{ is measurable and } \left( \int \left| f \right|^{p} d\mu \right)^{1/p} \lt \infty \right. \right\}. $$

確率論

表記法と用語

$$ \begin{array}{lll} \text{Analysts’ Term} && \text{Probabilists’ Term} \\ \hline \text{Measure space } (X, \mathcal{E}, \mu) \text{ such that } \mu (X) = 1 && \text{Probability space } (\Omega, \mathcal{F}, P) \\ \text{Measure } \mu : \mathcal{E} \to \mathbb{R} \text{ such that } \mu (X) = 1 && \text{Probability } P : \mathcal{F} \to \mathbb{R} \\ (\sigma\text{-)algebra $\mathcal{E}$ on $X$} && (\sigma\text{-)field $\mathcal{F}$ on $\Omega$} \\ \text{Mesurable set } E \in \mathcal{E} && \text{Event } E \in \mathcal{F} \\ \text{Measurable real-valued function } f : X \to \mathbb{R} && \text{Random variable } X : \Omega \to \mathbb{R} \\ \text{Integral of } f, {\displaystyle \int f d\mu} && \text{Expextation of } f, E(X) \\ f \text{ is } L^{p} && X \text{ has finite $p$th moment} \\ \text{Almost everywhere, a.e.} && \text{Almost surely, a.s.} \end{array} $$

$$ \begin{align*} \left\{ X \gt a \right\} &:= \left\{ w : X(w) \gt a \right\} \\ P\left( X \gt a \right) &:= P\left( \left\{ w : X(w) \gt a \right\} \right) \end{align*} $$

基礎定義

可測空間$(\Omega, \mathcal{F})$、$(\mathbb{R}, \mathcal{B}_{\mathbb{R}})$に対して、$(\mathcal{F}, \mathcal{B}_{\mathbb{R}})$-可測関数$X : \Omega \to \mathbb{R}$を確率変数と言います。つまり、 $$ X^{-1}(B) \in \mathcal{F}\qquad \forall B \in \mathcal{B}_{\mathbb{R}}. $$

$(\Omega, \mathcal{F})$上の確率(または確率測度)とは、$P(\Omega) = 1$を満たす測度$P : \mathcal{F} \to \mathbb{R}$です。

$X$を確率変数とする時、

  • 期待値: $\displaystyle E(X) := \int X dP$
  • 分散: $\sigma^{2}(X) := E\left[ (X - E(X))^{2} \right] = E(X^{2}) - E(X)^{2}$

$X$の(確率)分布とは、次を満たす$\mathbb{R}$上の確率$P_{X} : \mathcal{B}_{\mathbb{R}} \to \mathbb{R}$です: $$ P_{X}(B) := P(X^{-1}(B)). $$

$X$の分布関数$F_{X}$は次のように定義されます: $$ F_{X}(a) := P_{X}\left( (-\infty, a] \right) = P(X \le a). $$

確率変数の数列$\left\{ X_{i} \right\}_{i=1}^{n}$に対して、確率ベクトル$(X_{1}, \dots, X_{n})$は次のように定義される関数を言います: $$ (X_{1}, \dots, X_{n}) : \Omega \to \mathbb{R}^{n} $$ $$ (X_{1}, \dots, X_{n})(x) := (X_{1}(x), \dots, X_{n}(x)). $$

Note: $(X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n})= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})$。

$n=2$の場合を先に見ましょう。$(X, Y) : \Omega \to \mathbb{R}^{2}$に対して次が成立します。 $$ (X, Y)^{-1} (a, b) = \left\{ x \in \Omega : X(x) = a \right\} \cap \left\{ x \in \Omega : Y(x) = b \right\}. $$ 従って、全てのボレル集合$B_{1}$、$B_{2} \in \mathcal{B}_{\mathbb{R}}$に対して次を得ます。 $$ (X, Y)^{-1}(B_{1} \times B_{2}) = (X, Y)^{-1}(B_{1}, B_{2}) = X^{-1}(B_{1}) \cap Y^{-1}(B_{2}). $$ これを任意の$\mathbb{R}^{n}$に対して拡張すると、 $$ \begin{equation} \begin{aligned} (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) &= (X_{1}, \dots, X_{n})^{-1}(B_{1}, \dots, B_{n}) \\ &= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n}). \end{aligned} \end{equation} $$

$X_{1}, \dots, X_{n}$の結合分布とは確率ベクトル$(X_{1}, \dots, X_{n})$の確率分布で定義されます: $$ P_{(X_{1}, \dots, X_{n})} : \mathcal{B}_{\mathbb{R}^{n}} \to \mathbb{R}, $$ $$ P_{(X_{1}, \dots, X_{n})}(B_{1} \times \cdots \times B_{n}) := P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right). $$

独立

$P(E) \gt 0$の事象$E$に対して、$\Omega$上の確率 $$ P_{E}(F) = P(E|F) := P(E \cap F)/P(E) $$ を$E$上の条件付き確率と言います。

もし$P_{E}(F) = P(F)$なら、$F$を$E$と独立と言います: $$ \text{$F$ is independent of $E$} \iff P(E \cap F) = P(E)P(F). $$ 次が成立する時、$\Omega$の事象たちのコレクション$\left\{ E_{j} \right\}$が独立と言います: $$ P(E_{1} \cap \cdots \cap E_{n}) = P(E_{1}) P(E_{2}) \cdots P(E_{n}) = \prod \limits_{i=1}^{n} P(E_{j}). $$

$\Omega$上の確率変数たちのコレクション$\left\{ X_{j} \right\}$が独立ということは、全てのボレル集合$B_{j} \in \mathcal{B}_{\mathbb{R}}$に対して事象たち$\left\{ X_{j}^{-1}(B_{j}) \right\}$が独立ということを言います。つまり次の式が成立することを意味します: $$ P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) = \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})). $$

確率分布の定義と$(2)$により、上記式の左辺から次を得ます。 $$ \begin{align*} P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) &= P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right) \\ &= P_{(X_{1}, \dots, X_{n})} \left( B_{1} \times \cdots \times B_{n} \right). \end{align*} $$ 一方、積測度と確率分布の定義により、右辺から次を得ます。 $$ \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})) = \prod \limits_{j=1}^{n} P_{X_{j}}(B_{j}) = \left( \prod \limits_{j=1}^{n} P_{X_{j}} \right) \left( B_{1} \times \cdots \times B_{n} \right). $$ 従って$\left\{ X_{j} \right\}$が独立なら、 $$ P_{(X_{1}, \dots, X_{n})} = \prod\limits_{j=1}^{n}P_{X_{j}}. $$

$\left\{ X_{j} \right\}$が独立な確率変数の集合であることは、$\left\{ X_{j} \right\}$の結合分布がそれぞれの分布の積と同じであることと同値です。

参考文献

  • Robert G. Bartle, The Elements of Integration and Lebesgue Measure (1995)
  • Gerald B. Folland, Real Analysis: Modern Techniques and Their Applications (1999)