측도론으로 정의되는 조인트 분포와 마지널 분포
정의 1
확률 공간 $( \Omega , \mathcal{F} , P)$ 이 주어져 있다고 하자.
- 조인트 분포: $( \Omega , \mathcal{F} , P)$ 에서 정의된 두 확률 변수 $X$, $Y$ 가 있다고 할 때, 랜덤 벡터 $(X,Y) : \Omega \to \mathbb{R}^2$ 의 분포는 보렐 셋 $B \subset \mathcal{B} \left( \mathbb{R}^2 \right)$ 에 대해 $$ \begin{align*} P_{(X,Y)} (B) :=& P \left( (X,Y) \in B \right) \\ =& \int_{B} f_{(X,Y)} (x,y) d m_{2} (x,y) \end{align*} $$ 와 같이 정의되며, 이를 만족시키는 $f_{(X,Y)}$ 가 존재한다면 $X$, $Y$ 가 조인트 밀도를 가진다고 한다.
- 마지널 분포: 보렐 셋 $A \subset \mathbb{R}$ 에 대해 다음을 마지널 분포라고 한다. $$ P_{X} (A) := P_{(X,Y)} ( A \times \mathbb{R} ) \\ P_{Y} (A) := P_{(X,Y)} ( \mathbb{R} \times A ) $$
- 아직 측도론을 접하지 못했다면 확률 공간이라는 말은 무시해도 좋다.
공식
두 확률 변수의 합 $X+Y$ 에 대해서 위의 공식을 소개한다. 확률 변수의 합은 스트레이트하게 평균의 개념으로 이어지므로 그 중요성은 대단하다고 말할 수 있겠다.
조인트 밀도를 가진 $X$, $Y$ 에 대해 마지널 밀도는 다음과 같이 구해진다. $$ f_{X} (x) = \int_{\mathbb{R}} f (X,Y) (x,y) dy \\ f_{Y} (y) = \int_{\mathbb{R}} f (X,Y) (x,y) dx $$
$X$, $Y$ 가 조인트 밀도 $f_{X,Y}$ 를 가지면 $$ f_{X+Y} (z) = \int_{\mathbb{R}} f_{X,Y} (x , z - x) dx $$
유도
$y ' = x + y$ 라고 하면 푸비니 정리에 따라 $$ \begin{align*} f_{X+Y} (z) =& P ( X+Y \le z ) \\ =& P_{X,Y} \left( \left\{ (x,y) : x + y \le z \right\} \right) \\ =& \iint_{ \left\{ (x,y) : x + y \le z \right\} } f_{X,Y} (x,y) dx dy \\ =& \int_{\mathbb{R}} \int_{- \infty}^{z-x} f_{X,Y} (x,y) dy dx \\ =& \int_{- \infty}^{z} \int_{\mathbb{R}} f_{X,Y} (x,y ' - x) dx dy ' \end{align*} $$
■
Capinski. (1999). Measure, Integral and Probability: p173~174. ↩︎