수리통계학에서의 다변량 확률 분포
📂수리통계학수리통계학에서의 다변량 확률 분포
정의
- 표본 공간 Ω 에서 정의된 n 개의 확률 변수 Xi 에 대해 X=(X1,⋯,Xn) 를 n차원 랜덤 벡터random Vector라고 한다. X 의 치역 X(Ω) 를 공간이라고도 부른다.
- 다음을 만족하는 함수 FX:Rn→[0,1] 을 X 의 조인트joint 누적 분포 함수라고 한다.
FX(x1,⋯,xn):=P[X1≤x1,⋯,Xn≤xn]
- 어떤 h1,⋯,hn>0 들에 대해 다음을 만족하는 함수 MX 가 존재하면 X 의 적률 생성 함수라고 한다.
MX(t1,⋯,tn):=E[e∑k=1ntkXk]=E[k=1∏netkXk]∣t1∣<h1,⋯,∣tn∣<hn
이산
- D1: X 의 공간이 가산 집합이면 X 가 이산 랜덤 벡터라고 한다.
- D2: 다음을 만족하는 pX:Rn→[0,1] 을 이산 랜덤 벡터 X 의 조인트 확률 질량 함수라고 한다.
pX(x1,⋯,xn):=P[X1=x1,⋯,Xn=xn]
- D3: 1≤k≤n 에 대해 다음과 같은 PXk(xk) 를 마지널 확률 질량 함수라고 한다.
PXk(xk):=x1∑⋯xk−1∑xk+1∑⋯xn∑pX(x1,⋯,xn)
- D4: SX:={x∈Rn:pX(x)>0} 을 X 의 서포트라고 한다.
연속
- C1: 확률 변수 X 의 누적 분포 함수 FX=FX1,⋯,Xn 가 모든 x∈Rn 에서 연속이면 X 가 연속 랜덤 벡터라고 한다.
- C2: 다음을 만족하는 fX:Rn→[0,∞) 를 연속 랜덤 벡터 X 의 조인트 확률 밀도 함수라고 한다.
FX(x1,⋯,xn)=∫−∞x1⋯∫−∞xnfx(t1,⋯,tn)dt1⋯dtn
- C3: 1≤k≤n 에 대해 다음과 같은 fXk(tk) 를 마지널 확률 밀도 함수라고 한다.
fXk(tk):=∫∞x1⋯∫∞xk−1∫∞xk+1⋯∫∞xnfX(t1,⋯,tn)dt1⋯dk−1dk+1⋯dn
- C4: SX:={t∈Rn:fX(t)>0} 을 X 의 서포트라고 한다.
- 원래 랜덤 벡터random Vector는 확률 벡터random Vector로 번역되나, 고등학교를 졸업한 이상 Stochastic 혹은 Probabilistic 등과 혼용될 수 있어 원어 그대로 옮긴다.
- 원래 조인트 누적 분포 함수joint Cumulative Distribution function는 결합 확률 분포로 번역되나, 결합은 독립이나 종속에 대한 오해를 불러일으킬 수 있는 것 같아 원어 그대로 옮긴다.
- 원래 마지널 분포marginal distribution는 주변 분포로 번역되나, 경제학에서의 한계marginal와 마찬가지로 그 의미가 잘 전달되지 않는 것 같아 원어 그대로 옮긴다.
설명
다변량 확률 분포는 일변량 확률 분포를 다차원으로 일반화 시킨 것이며, 변수가 여러개라는 점에서 본질적으로 큰 차이가 있으나 적어도 학부 수준의 수리통계학에서는 미적분학적인 스킬로도 충분히 다를 수 있다. 어떤 점이 다른지 살펴보자:
- 1: 헷갈리지 말아야할 것은 랜덤 벡터 X:Ωn→Rn 역시 여전히 함수라는 것이다. 그래서 그 치역을 생각할 수 있고, 이를 통해 다변량에 대해서도 이산형과 연속형을 구분한다.
- C2: 연속 조인트 밀도 함수는 일반적으로 미적분학의 기본정리에 따라 확률이 0 인 A⊂Rn 를 제외한 곳에서 다음을 만족시키게끔 정의된다.
∂x1⋯∂xn∂nFX(x)=f(x)
- D3, C3: 식은 복잡하지만 한마디로 말해 조인트 확률 분포를 오로지 확률 변수 Xk 에 대한 분포로 바꿔놓은 것이다. 경제학에서 마지널이라는 단어가 미분의 개념과 통하는 것과 반대로 수리통계학에서는 적분이나 합으로 관심 없는 변수를 모조리 없애는 것이다.