測度論で定義される確率変数と確率分布
定義 1
確率空間 $( \Omega , \mathcal{F} , P)$ が与えられたとしよう。
- すべてのボレル集合 $B \in \mathcal{B} (\mathbb{R})$ に対して $X^{-1} (B) \in \mathcal{F}$ を満たす関数 $X : \Omega \to \mathbb{R}$ を 確率変数random variableと呼ぶ。
- 以下のように定義された$\mathcal{F}_{X}$ を $X$ によって生成されたシグマ場と呼ぶ。 $$ \mathcal{F}_{X} := X^{-1} ( \mathcal{B} ) = \sigma (X) = \left\{ X^{-1} (B) \in \Omega : B \in \mathcal{B}( \mathbb{R} ) \right\} $$
- 以下のように定義された測度 $P_{X}$ を$X$ の 確率分布probability distributionと呼ぶ。 $$ P_{X} (B) := P ( X^{-1} (B) ) $$
- 測度論についてまだ知らないなら、確率空間という言葉を無視してもいい。
説明
確率空間と同じように、確率変数も測度論で厳密に定義することができる。
- $X^{-1} (B) \in \mathcal{F}$ という言葉は、$X$ が $\Omega$ の要素を実数にマッピングして大小関係 $P(a \le X \le b)$ のようなものを使えるようにしつつ、ボレル集合の逆像がシグマ場に属させ、理にかなった集合だけを事象として扱うように制約を加えたことを意味している。一見すると過度に抽象的に見えるかもしれないが、逆説的に、その目的は過度な抽象性を失わせることにあるとも考えられる。定義によれば、確率変数$X$ は実数関数であるだけでなく可測関数となり、もし$\Omega = \mathbb{R}$ なら $\mathcal{F} = \mathcal{B} \left( \mathbb{R} \right)$ で、ただのボレル関数 $X : \mathbb{R} \to \mathbb{R}$ となる。通常、数理統計学の簡単な定理はこのレベルで十分。その先、多変数確率変数への一般化は、すべてのボレル集合 $B \in \mathcal{B} (\mathbb{R}^{p})$ に対して $X^{-1} (B) \in \mathcal{F}$ を満たす$X : \Omega \to \mathbb{R}^{p}$ を定義することによって簡単に行うことができる。もちろん、$X$ は各確率変数 $X_{i} : \Omega \to \mathbb{R}$ に対して$X = ( X_{1}, \cdots , X_{p})$ のようにベクトルとして表すことができ、確率ベクターと呼ばれる。これが確率変数の数列につながれば確率過程stochastic process、さらに一般的には確率要素random elementと呼ばれる。
- シグマ場$\mathcal{G}$ に対して$Y^{-1} ( \mathcal{B} ) \in \mathcal{G}$ ならば$Y$ が $\mathcal{G}$-可測であるというけれども、$\mathcal{F}_{X}$ の定義によれば、当然$X$ は$\mathcal{F}_{X}$-メジャラブルである。
- 定義が多くて混乱するかもしれないが、一つ一つ考えてみれば全く難しいことはない。$X^{-1} (B) \in \mathcal{F}$ であるため、これを逆関数のように考えると$X^{-1} : \mathcal{B} (\mathbb{R}) \to \mathcal{F}$ となる。このように、$P_{X} : = ( P \circ X^{-1} )$ は $$ P_{X} : \mathcal{B} (\mathbb{R}) \to \mathcal{F} \to [0,1] $$ と理解でき、ボレル集合$B$ に対して$0$ から$1$ までのどんな値にもマッピングする単なる合成関数にすぎない。例えば、$[-3,-2]$ は自然に$\mathbb{R}$ のボレル集合で、確率変数$Y$ がどのように定義されているかによって、$P_{Y} ( [-3,-2] ) = 0.7$ のような計算をすることができるようになるわけだ。
参考
Capinski. (1999). Measure, Integral and Probability: p66~68. ↩︎