logo

다변량정규분포의 선형변환 📂확률분포론

다변량정규분포의 선형변환

정리 1

선형변환의 정규성

행렬 ARm×nA \in \mathbb{R}^{m \times n}벡터 bRm\mathbf{b} \in \mathbb{R}^{m} 에 대해 다변량정규분포를 따르는 랜덤벡터 XNn(μ,Σ)\mathbf{X} \sim N_{n} \left( \mu , \Sigma \right)선형변환 Y=AX+b\mathbf{Y} = A \mathbf{X} + \mathbf{b} 는 여전히 다변량정규분포 Nm(Aμ+b,AΣAT)N_{m} \left( A \mu + \mathbf{b} , A \Sigma A^{T} \right) 를 따른다.

마지널 분포의 정규성

X=[X1X2]:ΩRnμ=[μ1μ2]RnΣ=[Σ11Σ12Σ21Σ22]Rn×n \begin{align*} \mathbf{X} =& \begin{bmatrix} \mathbf{X}_{1} \\ \mathbf{X}_{2} \end{bmatrix} & : \Omega \to \mathbb{R}^{n} \\ \mu =& \begin{bmatrix} \mu_{1} \\ \mu_{2} \end{bmatrix} & \in \mathbb{R}^{n} \\ \Sigma =& \begin{bmatrix} \Sigma_{11} & \Sigma_{12} \\ \Sigma_{21} & \Sigma_{22} \end{bmatrix} & \in \mathbb{R}^{n \times n} \end{align*} 위와 같이 X\mathbf{X}, μ\mu, Σ\Sigma조던블럭폼으로 나타냈다고 하자. 만약 XNn(μ,Σ)\mathbf{X} \sim N_{n} \left( \mu, \Sigma \right) 이라면, 그 마지널 랜덤벡터 중 하나인 X1X_{1} 는 다변량정규분포 Nm(μ1,Σ11)N_{m} \left( \mu_{1} , \Sigma_{11} \right) 를 따른다.

증명

선형변환

다변량정규분포의 적률생성함수: XNp(μ,Σ)X \sim N_{p} \left( \mu , \Sigma \right)적률생성함수는 다음과 같다. MX(t)=exp(tTμ+12tTΣt),tRp M_{X} \left( \mathbf{t} \right) = \exp \left( \mathbf{t}^{T} \mu + {{ 1 } \over { 2 }} \mathbf{t}^{T} \Sigma \mathbf{t} \right) \qquad , \mathbf{t} \in \mathbb{R}^{p}

다변량정규분포의 적률생성함수에서 직접연역할 것이다. Y\mathbf{Y} 의 적률생성함수는 다음과 같다. MY(t)=E[exp(tTY)]=E[exp(tT(AX+b))]=E[exp(tTb)]E[exp(tTAX)]=exp(tTb)E[exp((ATt)TX)]=exp(tTb)exp((ATt)T(μ+12ΣATt))=exp(tTb)exp((ATt)Tμ+12(tTAΣATt))=exp(tT(b+Aμ)+12(tTAΣATt)) \begin{align*} M_{\mathbf{Y}} \left( \mathbf{t} \right) =& E \left[ \exp \left( \mathbf{t}^{T} \mathbf{Y} \right) \right] \\ =& E \left[ \exp \left( \mathbf{t}^{T} \left( A \mathbf{X} + \mathbf{b} \right) \right) \right] \\ =& E \left[ \exp \left( \mathbf{t}^{T} \mathbf{b} \right) \right] E \left[ \exp \left( \mathbf{t}^{T} A \mathbf{X} \right) \right] \\ =& \exp \left( \mathbf{t}^{T} \mathbf{b} \right) E \left[ \exp \left( \left( A^{T} \mathbf{t} \right) ^{T} \mathbf{X} \right) \right] \\ =& \exp \left( \mathbf{t}^{T} \mathbf{b} \right) \exp \left( \left( A^{T} \mathbf{t} \right) ^{T} \left( \mu + {{ 1 } \over { 2 }} \Sigma A^{T} \mathbf{t} \right) \right) \\ =& \exp \left( \mathbf{t}^{T} \mathbf{b} \right) \exp \left( \left( A^{T} \mathbf{t} \right) ^{T} \mu + {{ 1 } \over { 2 }} \left( \mathbf{t}^{T} A \Sigma A^{T} \mathbf{t} \right) \right) \\ =& \exp \left( \mathbf{t}^{T} \left( \mathbf{b} + A \mu \right) + {{ 1 } \over { 2 }} \left( \mathbf{t}^{T} A \Sigma A^{T} \mathbf{t} \right) \right) \end{align*}

이는 Nm(Aμ+b,AΣAT)N_{m} \left( A \mu + \mathbf{b} , A \Sigma A^{T} \right) 의 적률생성함수와 같다.

마지널 분포

위 정리의 따름정리로써 자명하다. 항등행렬 ImRm×mI_{m} \in \mathbb{R}^{m \times m}영행렬 Om(nm)Rm×(nm)O_{m(n-m)} \in \mathbb{R}^{m \times (n-m)} 에 대해 행렬 ARm×nA \in \mathbb{R}^{m \times n}A=[ImOm(nm)] A = \begin{bmatrix} I_{m} & O_{m(n-m)} \end{bmatrix} 와 같이 정의하면 자연스럽게 X1=AX \mathbf{X}_{1} = A \mathbf{X} 이 된다. 이렇게 벡터의 일부 성분을 탈락시키는 매핑을 내추럴 프로젝션이라 부르기도 한다.


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p183. ↩︎