logo

측도론과 확률론 요약 정리 📂확률론

측도론과 확률론 요약 정리

개요

이미 측도론과 확률론을 공부한 사람을 위한 정의 및 개념 요약 자료이다. 빠른 복습과 정의를 찾아보는 편리함을 위해 작성되었다.

pdf 다운로드

측도론

대수

XX \ne \varnothing의 부분집합들의 컬렉션 A\mathcal{A}유한 합집합과 여집합에 대해 닫혀있을 때, 이를 대수라 한다.

가산 합집합에 대해 닫혀있는 대수를 σ\sigma-대수라 한다.

Note:

  • 정의에 따라 A\mathcal{A}는 또한 교집합에 대해서도 닫혀있다 (E1E2=(E1E2)cA\big( \because E_{1} \cap E_{2} = \left( E_{1} \cup E_{2} \right)^{c} \in \mathcal{A} for E1,E2A)E_{1}, E_{2} \in \mathcal{A} \big)
  • A\mathcal{A}는 공집합 \varnothing과 전체집합 XX을 포함한다. (EA\big( \because E \in \mathcal{A}     \implies =EEcA and X=EEcA)\varnothing = E \cap E^{c} \in \mathcal{A} \text{ and } X = E \cup E^{c} \in \mathcal{A} \big)

XX가 위상공간이면, XX의 열린집합들의 컬렉션으로부터 만들어지는 σ\sigma-대수를 XX 상의 보렐 σ\sigma-대수라 하고 BX\mathcal{B}_{X}라 표기한다.

  • 보렐 σ\sigma-대수는 모든 열린집합을 포함하는 가장 작은 유일한 σ\sigma-대수이다.

E\mathcal{E}XX 상의 σ\sigma-대수라 하자. 순서쌍 (X,E)(X, \mathcal{E})가측공간 이라 하고, EEE \in \mathcal{E}가측 집합이라 한다.

별다른 언급이 없으면, 아래에서는 고정된 가측 공간 (X,E)(X, \mathcal{E})에 대해서 다룬다.

가측 함수

모든 실수 αR\alpha \in \mathbb{R}에 대해서, 다음을 만족하는 함수 f:XRf : X \to \mathbb{R}을 (E\mathcal{E}-)가측이라 한다. {xX:f(x)>α}EαR. \left\{ x \in X : f(x) \gt \alpha \right\} \in \mathcal{E}\qquad \forall \alpha \in \mathbb{R}.

일반화

(X,E)(X, \mathcal{E}), (Y,F)(Y, \mathcal{F})를 가측공간이라 하자. 함수 f:XYf : X \to Y가 다음을 만족할 때, 이를 (E,F)(\mathcal{E}, \mathcal{F})-가측이라 한다. f1(F)={xX:f(x)F}EFF. f^{-1}(F) = \left\{ x \in X : f(x) \in F \right\} \in \mathcal{E}\qquad \forall F \in \mathcal{F}.

Note: E\mathcal{E}-가측 함수는 위의 정의에서 (Y,F)=(R,BR)(Y, \mathcal{F}) = (\mathbb{R}, \mathcal{B}_{\mathbb{R}})인 경우와 같다.

측도

E\mathcal{E} (혹은 (X,E)(X, \mathcal{E}), XX) 위의 측도란 다음을 만족하는 함수 μ:E[0,]\mu : \mathcal{E} \to [0, \infty]이다.

  • Null empty set: μ()=0\mu (\varnothing) = 0.
  • Countable additivity: {Ej}\left\{ E_{j} \right\}E\mathcal{E}의 서로소인 집합들이면, μ(jEj)=jμ(Ej)\displaystyle \mu \left( \bigcup\limits_{j} E_{j} \right) = \sum\limits_{j} \mu (E_{j}).

트리플 (X,E,μ)(X, \mathcal{E}, \mu)측도 공간이라 한다. 별다른 언급이 없으면 아래에서는 고정된 측도 공간 (X,E,μ)(X, \mathcal{E}, \mu)에 대해서 다룬다.

보렐 측도란, 정의역이 보렐 σ\sigma-대수 BR\mathcal{B}_{\mathbb{R}}인 측도를 말한다: μ:BR[0,] \mu : \mathcal{B}_{\mathbb{R}} \to [0, \infty]

(X,E)(X, \mathcal{E}), (Y,F)(Y, \mathcal{F}) 위의 두 측도 μ\mu, ν\nu에 대해서, 다음을 만족하는 E×F\mathcal{E} \times \mathcal{F} 위의 유일한 측도 μ×ν\mu \times \nuμ\muν\nu곱 측도라 한다. μ×ν(E×F)=μ(E)ν(F) for all rectangles E×F. \mu \times \nu (E \times F) = \mu (E) \nu (F)\qquad \text{ for all rectangles } E \times F.

적분

실함수 ff가 유한한 함숫값을 가질 때, 이를 단순하다고 한다.

단순 가측함수 φ\varphi는 다음과 같은 꼴로 표현된다. φ=j=1najχEj, where Ej=φ1({aj}) and range(φ)={a1,,an}. \begin{equation} \varphi = \sum\limits_{j=1}^{n} a_{j}\chi_{E_{j}}, \text{ where } E_{j} = \varphi^{-1}(\left\{ a_{j} \right\}) \text{ and } \operatorname{range} (\varphi) = \left\{ a_{1}, \dots, a_{n} \right\}. \end{equation} 여기서 χEj\chi_{E_{j}}EjE_{j}의 특성 함수이다. 이를 φ\varphistandard representation이라 한다.

φ\varphi가 standard representation (1)(1)을 갖는 단순 가측함수일 때, 측도 μ\mu에 대한 φ\varphi의 적분을 다음과 같이 정의한다. φdμ:=j=1najμ(Ej). \int \varphi d\mu := \sum\limits_{j=1}^{n} a_{j}\mu (E_{j}). Notation: φdμ=φ=φ(x)dμ(x),=X. \int \varphi d\mu = \int \varphi = \int \varphi(x) d\mu (x), \qquad \int = \int_{X}.

ff(X,E)(X, \mathcal{E}) 위의 가측함수일 때, μ\mu에 대한 ff의 적분을 다음과 같이 정의한다. fdμ:=sup{φdμ:0φf,φ is simple and measurable}. \int f d\mu := \sup \left\{ \int \varphi d\mu : 0 \le \varphi \le f, \varphi \text{ is simple and measurable} \right\}.

f:XRf : X \to \mathbb{R}양의 부분음의 부분을 각각 다음과 같이 정의한다. f+(x):=max(f(x),0)),f1(x):=min(f(x),0)). f^{+}(x) := \max \left( f(x), 0 \right)),\qquad f^{-1}(x) := \min \left(-f(x), 0 \right)). 만약 두 적분 f+\displaystyle \int f^{+}, f\displaystyle \int f^{-}이 유한하면, ff적분가능하다고 한다. 또한 f=f+f\left| f \right| = f^{+} - f^{-}가 성립한다.

적분가능한 실함수들의 집합은 벡터공간이며 적분은 이 벡터공간 위의 선형 범함수이다. 이 벡터공간을 다음과 같이 표기한다. L=L(X,E,μ)=L(X,μ)=L(X)=L(μ),L=L1 L = L(X, \mathcal{E}, \mu) = L(X, \mu) = L(X) = L(\mu), \qquad L = L^{1}

LpL^{p} 공간

측도 공간 (X,E,μ)(X, \mathcal{E}, \mu)0<p<0 \lt p \lt \infty에 대해서, LpL^{p}를 다음과 같이 정의한다. Lp(X,E,μ):={f:XRf is measurable and (fpdμ)1/p<}. L^{p}(X, \mathcal{E}, \mu) := \left\{ f : X \to \mathbb{R} \left| f \text{ is measurable and } \left( \int \left| f \right|^{p} d\mu \right)^{1/p} \lt \infty \right. \right\}.

확률론

표기법과 용어

Analysts’ TermProbabilists’ TermMeasure space (X,E,μ) such that μ(X)=1Probability space (Ω,F,P)Measure μ:ER such that μ(X)=1Probability P:FR(σ-)algebra E on X(σ-)field F on ΩMesurable set EEEvent EFMeasurable real-valued function f:XRRandom variable X:ΩRIntegral of f,fdμExpextation of f,E(X)f is LpX has finite pth momentAlmost everywhere, a.e.Almost surely, a.s. \begin{array}{lll} \text{Analysts’ Term} && \text{Probabilists’ Term} \\ \hline \text{Measure space } (X, \mathcal{E}, \mu) \text{ such that } \mu (X) = 1 && \text{Probability space } (\Omega, \mathcal{F}, P) \\ \text{Measure } \mu : \mathcal{E} \to \mathbb{R} \text{ such that } \mu (X) = 1 && \text{Probability } P : \mathcal{F} \to \mathbb{R} \\ (\sigma\text{-)algebra E\mathcal{E} on XX} && (\sigma\text{-)field F\mathcal{F} on Ω\Omega} \\ \text{Mesurable set } E \in \mathcal{E} && \text{Event } E \in \mathcal{F} \\ \text{Measurable real-valued function } f : X \to \mathbb{R} && \text{Random variable } X : \Omega \to \mathbb{R} \\ \text{Integral of } f, {\displaystyle \int f d\mu} && \text{Expextation of } f, E(X) \\ f \text{ is } L^{p} && X \text{ has finite ppth moment} \\ \text{Almost everywhere, a.e.} && \text{Almost surely, a.s.} \end{array}

{X>a}:={w:X(w)>a}P(X>a):=P({w:X(w)>a}) \begin{align*} \left\{ X \gt a \right\} &:= \left\{ w : X(w) \gt a \right\} \\ P\left( X \gt a \right) &:= P\left( \left\{ w : X(w) \gt a \right\} \right) \end{align*}

기초 정의

가측공간 (Ω,F)(\Omega, \mathcal{F}), (R,BR)(\mathbb{R}, \mathcal{B}_{\mathbb{R}})에 대해서, (F,BR)(\mathcal{F}, \mathcal{B}_{\mathbb{R}})-가측 함수 X:ΩRX : \Omega \to \mathbb{R}확률 변수라 한다. 다시말해, X1(B)FBBR. X^{-1}(B) \in \mathcal{F}\qquad \forall B \in \mathcal{B}_{\mathbb{R}}.

(Ω,F)(\Omega, \mathcal{F}) 위의 확률(혹은 확률 측도)이란, P(Ω)=1P(\Omega) = 1를 만족하는 측도 P:FRP : \mathcal{F} \to \mathbb{R}이다.

XX를 확률변수라고 할 때,

  • 기댓값: E(X):=XdP\displaystyle E(X) := \int X dP
  • 분산: σ2(X):=E[(XE(X))2]=E(X2)E(X)2\sigma^{2}(X) := E\left[ (X - E(X))^{2} \right] = E(X^{2}) - E(X)^{2}

XX(확률) 분포란, 다음을 만족하는 R\mathbb{R} 위의 확률 PX:BRRP_{X} : \mathcal{B}_{\mathbb{R}} \to \mathbb{R}이다: PX(B):=P(X1(B)). P_{X}(B) := P(X^{-1}(B)).

XX분포 함수 FXF_{X}는 다음과 같이 정의된다: FX(a):=PX((,a])=P(Xa). F_{X}(a) := P_{X}\left( (-\infty, a] \right) = P(X \le a).

확률 변수의 수열 {Xi}i=1n\left\{ X_{i} \right\}_{i=1}^{n}에 대해서, 확률 벡터 (X1,,Xn)(X_{1}, \dots, X_{n})는 다음과 같이 정의되는 함수를 말한다: (X1,,Xn):ΩRn (X_{1}, \dots, X_{n}) : \Omega \to \mathbb{R}^{n} (X1,,Xn)(x):=(X1(x),,Xn(x)). (X_{1}, \dots, X_{n})(x) := (X_{1}(x), \dots, X_{n}(x)).

Note: (X1,,Xn)1(B1××Bn)=X11(B1)Xn1(Bn)(X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n})= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n}).

n=2n=2인 경우를 먼저 보자. (X,Y):ΩR2(X, Y) : \Omega \to \mathbb{R}^{2}에 대해서 다음이 성립한다. (X,Y)1(a,b)={xΩ:X(x)=a}{xΩ:Y(x)=b}. (X, Y)^{-1} (a, b) = \left\{ x \in \Omega : X(x) = a \right\} \cap \left\{ x \in \Omega : Y(x) = b \right\}. 따라서, 모든 보렐 집합 B1B_{1}, B2BRB_{2} \in \mathcal{B}_{\mathbb{R}}에 대해서 다음을 얻는다. (X,Y)1(B1×B2)=(X,Y)1(B1,B2)=X1(B1)Y1(B2). (X, Y)^{-1}(B_{1} \times B_{2}) = (X, Y)^{-1}(B_{1}, B_{2}) = X^{-1}(B_{1}) \cap Y^{-1}(B_{2}). 이를 임의의 Rn\mathbb{R}^{n}에 대해서 확장하면, (X1,,Xn)1(B1××Bn)=(X1,,Xn)1(B1,,Bn)=X11(B1)Xn1(Bn). \begin{equation} \begin{aligned} (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) &= (X_{1}, \dots, X_{n})^{-1}(B_{1}, \dots, B_{n}) \\ &= X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n}). \end{aligned} \end{equation}

X1,,XnX_{1}, \dots, X_{n}조인트 분포란 확률 벡터 (X1,,Xn)(X_{1}, \dots, X_{n})의 확률 분포로 정의된다: P(X1,,Xn):BRnR, P_{(X_{1}, \dots, X_{n})} : \mathcal{B}_{\mathbb{R}^{n}} \to \mathbb{R}, P(X1,,Xn)(B1××Bn):=P((X1,,Xn)1(B1××Bn)). P_{(X_{1}, \dots, X_{n})}(B_{1} \times \cdots \times B_{n}) := P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right).

독립

P(E)>0P(E) \gt 0인 사건 EE에 대해서, Ω\Omega 위의 확률 PE(F)=P(EF):=P(EF)/P(E) P_{E}(F) = P(E|F) := P(E \cap F)/P(E) EE 위의 조건부 확률이라 한다.

만약 PE(F)=P(F)P_{E}(F) = P(F)이면, FFEE독립이라고 한다: F is independent of E    P(EF)=P(E)P(F). \text{FF is independent of EE} \iff P(E \cap F) = P(E)P(F). 다음이 성립할 때, Ω\Omega의 사건들의 컬렉션 {Ej}\left\{ E_{j} \right\}이 독립이라고 한다: P(E1En)=P(E1)P(E2)P(En)=i=1nP(Ej). P(E_{1} \cap \cdots \cap E_{n}) = P(E_{1}) P(E_{2}) \cdots P(E_{n}) = \prod \limits_{i=1}^{n} P(E_{j}).

Ω\Omega 위의 확률변수들의 컬렉션 {Xj}\left\{ X_{j} \right\}독립이라는 것은, 모든 보렐집합 BjBRB_{j} \in \mathcal{B}_{\mathbb{R}}에 대해서 사건들 {Xj1(Bj)}\left\{ X_{j}^{-1}(B_{j}) \right\}이 독립이라는 것을 말한다. 즉 다음의 식이 성립하는 것을 의미한다: P(X11(B1)Xn1(Bn))=j=1nP(Xj1(Bj)). P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) = \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})).

확률분포의 정의와 (2)(2)에 의해, 위 식의 좌변으로부터 다음을 얻는다. P(X11(B1)Xn1(Bn))=P((X1,,Xn)1(B1××Bn))=P(X1,,Xn)(B1××Bn). \begin{align*} P\left(X_{1}^{-1}(B_{1}) \cap \cdots \cap X_{n}^{-1}(B_{n})\right) &= P\left( (X_{1}, \dots, X_{n})^{-1}(B_{1} \times \cdots \times B_{n}) \right) \\ &= P_{(X_{1}, \dots, X_{n})} \left( B_{1} \times \cdots \times B_{n} \right). \end{align*} 한편, 곱측도와 확률분포의 정의에 의해, 우변으로부터 다음을 얻는다. j=1nP(Xj1(Bj))=j=1nPXj(Bj)=(j=1nPXj)(B1××Bn). \prod \limits_{j=1}^{n} P(X_{j}^{-1}(B_{j})) = \prod \limits_{j=1}^{n} P_{X_{j}}(B_{j}) = \left( \prod \limits_{j=1}^{n} P_{X_{j}} \right) \left( B_{1} \times \cdots \times B_{n} \right). 따라서 {Xj}\left\{ X_{j} \right\}가 독립이면, P(X1,,Xn)=j=1nPXj. P_{(X_{1}, \dots, X_{n})} = \prod\limits_{j=1}^{n}P_{X_{j}}.

{Xj}\left\{ X_{j} \right\}가 독립인 확률변수의 집합이라는 것은, {Xj}\left\{ X_{j} \right\}의 조인트 분포가 각각의 분포의 곱과 같다는 것과 동치이다.

참고문헌

  • Robert G. Bartle, The Elements of Integration and Lebesgue Measure (1995)
  • Gerald B. Folland, Real Analysis: Modern Techniques and Their Applications (1999)