logo

측도론과 확률론 요약 정리 📂確率論

측도론과 확률론 요약 정리

概要

測度論と確率論を学んだ人向けの定義と概念の要約資料です。迅速な復習と定義の参照のために作成されました。

測度論

代数

XX \ne \varnothingの部分集合たちのコレクション A\mathcal{A}有限 合集合と補集合に対して閉じている時、これを代数と言います。

可算合集合に対して閉じている代数をσ\sigma-代数と言います。

Note:

  • 定義により A\mathcal{A}はまた交集合に対しても閉じています (E1E2=(E1E2)cA\big( \because E_{1} \cap E_{2} = \left( E_{1} \cup E_{2} \right)^{c} \in \mathcal{A} for E1,E2A)E_{1}, E_{2} \in \mathcal{A} \big)
  • A\mathcal{A}は空集合 \varnothingと全集合 XXを含みます。 (EA\big( \because E \in \mathcal{A}     \implies =EEcA and X=EEcA)\varnothing = E \cap E^{c} \in \mathcal{A} \text{ and } X = E \cup E^{c} \in \mathcal{A} \big)

XXが位相空間なら、XXの開集合たちのコレクションから作られるσ\sigma-代数をXX上のボレル σ\sigma-代数と言い、BX\mathcal{B}_{X}と表記します。

  • ボレル σ\sigma-代数は全ての開集合を含む最も小さい唯一のσ\sigma-代数です。

E\mathcal{E}XX上のσ\sigma-代数としましょう。順序対 (X,E)(X, \mathcal{E})可測空間と言い、EEE \in \mathcal{E}可測集合と言います。

特に言及がない限り、以下では固定された可測空間 (X,E)(X, \mathcal{E})について扱います。

可測関数

全ての実数 αR\alpha \in \mathbb{R}に対して、次を満たす関数 f:XRf : X \to \mathbb{R}を(E\mathcal{E}-)可測と言います。 {xX:f(x)>α}EαR. \left\{ x \in X : f(x) \gt \alpha \right\} \in \mathcal{E}\qquad \forall \alpha \in \mathbb{R}.

一般化

(X,E)(X, \mathcal{E})(Y,F)(Y, \mathcal{F})を可測空間とします。関数 f:XYf : X \to Yが次を満たす時、これを(E,F)(\mathcal{E}, \mathcal{F})-可測と言います。 f1(F)={xX:f(x)F}EFF. f^{-1}(F) = \left\{ x \in X : f(x) \in F \right\} \in \mathcal{E}\qquad \forall F \in \mathcal{F}.

Note: E\mathcal{E}-可測関数は上の定義で(Y,F)=(R,BR)(Y, \mathcal{F}) = (\mathbb{R}, \mathcal{B}_{\mathbb{R}})の場合と同じです。

測度

E\mathcal{E} (または (X,E)(X, \mathcal{E})XX)上の測度とは、次を満たす関数 μ:E[0,]\mu : \mathcal{E} \to [0, \infty]です。

  • Null empty set: μ()=0\mu (\varnothing) = 0
  • Countable additivity: {Ej}\left\{ E_{j} \right\}E\mathcal{E}の互いに素な集合たちなら、μ(jEj)=jμ(Ej)\displaystyle \mu \left( \bigcup\limits_{j} E_{j} \right) = \sum\limits_{j} \mu (E_{j})

三つ組 (X,E,μ)(X, \mathcal{E}, \mu)測度空間と言います。特に言及がない限り以下では固定された測度空間 (X,E,μ)(X, \mathcal{E}, \mu)について扱います。

ボレル測度とは、定義域がボレル σ\sigma-代数BR\mathcal{B}_{\mathbb{R}}の測度を言います: μ:BR[0,] \mu : \mathcal{B}_{\mathbb{R}} \to [0, \infty]

(X,E)(X, \mathcal{E})(Y,F)(Y, \mathcal{F})上の二つの測度 μ\muν\nuに対して、次を満たすE×F\mathcal{E} \times \mathcal{F}上の唯一の測度 μ×ν\mu \times \nuμ\muν\nu積測度と言います。 μ×ν(E×F)=μ(E)ν(F) for all rectangles E×F. \mu \times \nu (E \times F) = \mu (E) \nu (F)\qquad \text{ for all rectangles } E \times F.

積分

実関数 ffが有限な関数値を持つ時、これを単純と言います。

単純可測関数 φ\varphiは次のような形で表されます。 φ=j=1najχEj, where Ej=φ1({aj}) and range(φ)={a1,,an}. \begin{equation} \varphi = \sum\limits_{j=1}^{n} a_{j}\chi_{E_{j}}, \text{ where } E_{j} = \varphi^{-1}(\left\{ a_{j} \right\}) \text{ and } \operatorname{range} (\varphi) = \left\{ a_{1}, \dots, a_{n} \right\}. \end{equation} ここで χEj\chi_{E_{j}}EjE_{j}の特性関数です。これをφ\varphistandard representationと言います。

φ\varphiがstandard representation (1)(1)を持つ単純可測関数の時、測度 μ\muに対する**φ\varphiの積分**を次のように定義します。 φdμ:=j=1najμ(Ej). \int \varphi d\mu := \sum\limits_{j=1}^{n} a_{j}\mu (E_{j}). Notation: φdμ=φ=φ(x)dμ(x),=X. \int \varphi d\mu = \int \varphi = \int \varphi(x) d\mu (x), \qquad \int = \int_{X}.

ff(X,E)(X, \mathcal{E})上の可測関数の時、μ\muに対する**ffの積分**を次のように定義します。 fdμ:=sup{φdμ:0φf,φ is simple and measurable}. \int f d\mu := \sup \left\{ \int \varphi d\mu : 0 \le \varphi \le f, \varphi \text{ is simple and measurable} \right\}.

f:XRf : X \to \mathbb{R}正の部分負の部分をそれぞれ次のように定義します。 f+(x):=max(f(x),0)),f1(x):=min(f(x),0)). f^{+}(x) := \max \left( f(x), 0 \right)),\qquad f^{-1}(x) := \min \left(-f(x), 0 \right)). もし二つの積分f+\displaystyle \int f^{+}f\displaystyle \int f^{-}が有限なら、ff積分可能と言います。またf=f+f\left| f \right| = f^{+} - f^{-}が成立します。

積分可能な実関数たちの集合はベクトル空間であり、積分はこのベクトル空間上の線形汎関数です。このベクトル空間を次のように表記します。 L=L(X,E,μ)=L(X,μ)=L(X)=L(μ),L=L1 L = L(X, \mathcal{E}, \mu) = L(X, \mu) = L(X) = L(\mu), \qquad L = L^{1}

LpL^{p}空間

測度空間(X,E,μ)(X, \mathcal{E}, \mu)0<p<0 \lt p \lt \inftyに対して、LpL^{p}を次のように定義します。 Lp(X,E,μ):={f:XRf is measurable and (fpdμ)1/p<}. L^{p}(X, \mathcal{E}, \mu) := \left\{ f : X \to \mathbb{R} \left| f \text{ is measurable and } \left( \int \left| f \right|^{p} d\mu \right)^{1/p} \lt \infty \right. \right\}.

確率論

表記法と用語

Analysts’ TermProbabilists’ TermMeasure space (X,E,μ) such that μ(X)=1Probability space (Ω,F,P)Measure μ:ER such that μ(X)=1Probability P:FR(σ-)algebra E on X(σ-)field F on ΩMesurable set EEEvent EFMeasurable real-valued function f:XRRandom variable X:ΩRIntegral of f,fdμExpextation of f,E(X)f is LpX has finite pth momentAlmost everywhere, a.e.Almost surely, a.s. \begin{array}{lll} \text{Analysts’ Term} && \text{Probabilists’ Term} \\ \hline \text{Measure space } (X, \mathcal{E}, \mu) \text{ such that } \mu (X) = 1 && \text{Probability space } (\Omega, \mathcal{F}, P) \\ \text{Measure } \mu : \mathcal{E} \to \mathbb{R} \text{ such that } \mu (X) = 1 && \text{Probability } P : \mathcal{F} \to \mathbb{R} \\ (\sigma\text{-)algebra E\mathcal{E} on XX} && (\sigma\text{-)field F\mathcal{F} on Ω\Omega} \\ \text{Mesurable set } E \in \mathcal{E} && \text{Event } E \in \mathcal{F} \\ \text{Measurable real-valued function } f : X \to \mathbb{R} && \text{Random variable } X : \Omega \to \mathbb{R} \\ \text{Integral of } f, {\displaystyle \int f d\mu} && \text{Expextation of } f, E(X) \\ f \text{ is } L^{p} && X \text{ has finite ppth moment} \\ \text{Almost everywhere, a.e.} && \text{Almost surely, a.s.} \end{array}

{X>a}:={w:X(w)>a}P(X>a):=P({w:X(w)>a}) \begin{align*} \left\{ X \gt a \right\} &:= \left\{ w : X(w) \gt a \right\} \\ P\left( X \gt a \right) &:= P\left( \left\{ w : X(w) \gt a \right\} \right) \end{align*}

基礎定義

可測空間(Ω,F)(\Omega, \mathcal{F})(R,BR)(\mathbb{R}, \mathcal{B}_{\mathbb{R}})に対して、(F,BR)(\mathcal{F}, \mathcal{B}_{\mathbb{R}})-可測関数X:ΩRX : \Omega \to \mathbb{R}確率変数と言います。つまり、 X1(B)FBBR. X^{-1}(B) \in \mathcal{F}\qquad \forall B \in \mathcal{B}_{\mathbb{R}}.

(Ω,F)(\Omega, \mathcal{F})上の確率(または確率測度)とは、P(Ω)=1P(\Omega) = 1を満たす測度P:FRP : \mathcal{F} \to \mathbb{R}です。

XXを確率変数とする時、

  • 期待値: E(X):=XdP\displaystyle E(X) := \int X dP
  • 分散: σ2(X):=E[(XE(X))2]=E(X2)E(X)2\sigma^{2}(X) := E\left[ (X - E(X))^{2} \right] = E(X^{2}) - E(X)^{2}

XX(確率)分布とは、次を満たすR\mathbb{R}上の確率PX:BRRP_{X} : \mathcal{B}_{\mathbb{R}} \to \mathbb{R}です: PX(B):=P(X1(B)). P_{X}(B) := P(X^{-1}(B)).

XX分布関数FXF_{X}は次のように定義されます: FX(a):=PX((,a])=P(Xa). F_{X}(a) := P_{X}\left( (-\infty, a] \right) = P(X \le a).

確率変数の数列{Xi}i=1n\left\{ X_{i} \right\}_{i=1}^{n}に対して、確率ベクトル(X1,,Xn)(X_{1}, \dots, X_{n})は次のように定義される関数を言います: (X1,,Xn):ΩRn (X_{1}, \dots, X_{n}) : \Omega \to \mathbb{R}^{n} (X1,,Xn)(x):=(X1(x),,Xn(x)). (X_{1}, \dots, X_{n})(x) := (X_{1}(x), \dots, X_{n}(x)).

Note: (X1,,Xn)1(B1××Bn)=X11(B1)Xn1(Bn)(X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n})= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})

n=2n=2の場合を先に見ましょう。(X,Y):ΩR2(X, Y) : \Omega \to \mathbb{R}^{2}に対して次が成立します。 (X,Y)1(a,b)={xΩ:X(x)=a}{xΩ:Y(x)=b}. (X, Y)^{-1} (a, b) = \left\{ x \in \Omega : X(x) = a \right\} \cap \left\{ x \in \Omega : Y(x) = b \right\}. 従って、全てのボレル集合B1B_{1}B2BRB_{2} \in \mathcal{B}_{\mathbb{R}}に対して次を得ます。 (X,Y)1(B1×B2)=(X,Y)1(B1,B2)=X1(B1)Y1(B2). (X, Y)^{-1}(B_{1} \times B_{2}) = (X, Y)^{-1}(B_{1}, B_{2}) = X^{-1}(B_{1}) \cap Y^{-1}(B_{2}). これを任意のRn\mathbb{R}^{n}に対して拡張すると、 (X1,,Xn)1(B1××Bn)=(X1,,Xn)1(B1,,Bn)=X11(B1)Xn1(Bn). \begin{equation} \begin{aligned} (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) &= (X_{1}, \dots, X_{n})^{-1}(B_{1}, \dots, B_{n}) \\ &= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n}). \end{aligned} \end{equation}

X1,,XnX_{1}, \dots, X_{n}結合分布とは確率ベクトル(X1,,Xn)(X_{1}, \dots, X_{n})の確率分布で定義されます: P(X1,,Xn):BRnR, P_{(X_{1}, \dots, X_{n})} : \mathcal{B}_{\mathbb{R}^{n}} \to \mathbb{R}, P(X1,,Xn)(B1××Bn):=P((X1,,Xn)1(B1××Bn)). P_{(X_{1}, \dots, X_{n})}(B_{1} \times \cdots \times B_{n}) := P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right).

独立

P(E)>0P(E) \gt 0の事象EEに対して、Ω\Omega上の確率 PE(F)=P(EF):=P(EF)/P(E) P_{E}(F) = P(E|F) := P(E \cap F)/P(E) EE上の条件付き確率と言います。

もしPE(F)=P(F)P_{E}(F) = P(F)なら、FFEE独立と言います: F is independent of E    P(EF)=P(E)P(F). \text{FF is independent of EE} \iff P(E \cap F) = P(E)P(F). 次が成立する時、Ω\Omegaの事象たちのコレクション{Ej}\left\{ E_{j} \right\}が独立と言います: P(E1En)=P(E1)P(E2)P(En)=i=1nP(Ej). P(E_{1} \cap \cdots \cap E_{n}) = P(E_{1}) P(E_{2}) \cdots P(E_{n}) = \prod \limits_{i=1}^{n} P(E_{j}).

Ω\Omega上の確率変数たちのコレクション{Xj}\left\{ X_{j} \right\}独立ということは、全てのボレル集合BjBRB_{j} \in \mathcal{B}_{\mathbb{R}}に対して事象たち{Xj1(Bj)}\left\{ X_{j}^{-1}(B_{j}) \right\}が独立ということを言います。つまり次の式が成立することを意味します: P(X11(B1)Xn1(Bn))=j=1nP(Xj1(Bj)). P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) = \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})).

確率分布の定義と(2)(2)により、上記式の左辺から次を得ます。 P(X11(B1)Xn1(Bn))=P((X1,,Xn)1(B1××Bn))=P(X1,,Xn)(B1××Bn). \begin{align*} P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) &= P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right) \\ &= P_{(X_{1}, \dots, X_{n})} \left( B_{1} \times \cdots \times B_{n} \right). \end{align*} 一方、積測度と確率分布の定義により、右辺から次を得ます。 j=1nP(Xj1(Bj))=j=1nPXj(Bj)=(j=1nPXj)(B1××Bn). \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})) = \prod \limits_{j=1}^{n} P_{X_{j}}(B_{j}) = \left( \prod \limits_{j=1}^{n} P_{X_{j}} \right) \left( B_{1} \times \cdots \times B_{n} \right). 従って{Xj}\left\{ X_{j} \right\}が独立なら、 P(X1,,Xn)=j=1nPXj. P_{(X_{1}, \dots, X_{n})} = \prod\limits_{j=1}^{n}P_{X_{j}}.

{Xj}\left\{ X_{j} \right\}が独立な確率変数の集合であることは、{Xj}\left\{ X_{j} \right\}の結合分布がそれぞれの分布の積と同じであることと同値です。

参考文献

  • Robert G. Bartle, The Elements of Integration and Lebesgue Measure (1995)
  • Gerald B. Folland, Real Analysis: Modern Techniques and Their Applications (1999)