정규분포 랜덤벡터 이차형식의 적률생성함수
📂수리통계학 정규분포 랜덤벡터 이차형식의 적률생성함수 정리 샘플 X = ( X 1 , ⋯ , X n ) \mathbf{X} = \left( X_{1} , \cdots , X_{n} \right) X = ( X 1 , ⋯ , X n ) 이 X 1 , ⋯ , X n ∼ iid N ( 0 , σ 2 ) X_{1} , \cdots , X_{n} \overset{\text{iid}}{\sim} N \left( 0, \sigma^{2} \right) X 1 , ⋯ , X n ∼ iid N ( 0 , σ 2 ) 와 같이 iid 로 정규분포 를 따른다고 하자. 랭크 가 r ≤ n r \le n r ≤ n 인 대칭행렬 A ∈ R n × n A \in \mathbb{R}^{n \times n} A ∈ R n × n 에 대해 랜덤벡터 이차형식 Q = σ − 2 X T A X Q = \sigma^{-2} \mathbf{X}^{T} A \mathbf{X} Q = σ − 2 X T A X 의 적률생성함수 는 다음과 같다.
M Q ( t ) = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 = det ( I n − 2 t A ) − 1 / 2 , ∣ t ∣ < 1 / 2 λ 1
M_{Q} (t) = \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} = \det \left( I_{n} - 2 t A \right)^{-1/2} \qquad , | t | < 1 / 2 \lambda_{1}
M Q ( t ) = i = 1 ∏ r ( 1 − 2 t λ i ) − 1/2 = det ( I n − 2 t A ) − 1/2 , ∣ t ∣ < 1/2 λ 1
여기서 I n ∈ R n × n I_{n} \in \mathbb{R}^{n \times n} I n ∈ R n × n 은 항등행렬 , det \det det 는 행렬식 이다. λ 1 ≥ ⋯ ≥ λ r \lambda_{1} \ge \cdots \ge \lambda_{r} λ 1 ≥ ⋯ ≥ λ r 은 A A A 의 0 0 0 이 아닌 고유값 을 일반성을 잃지 않고 내림차순으로 나열한 것이다.
설명 이 정리는 호그-크레이그 정리의 증명 에 쓰인다.
증명 n n n -차원 영벡터 를 0 n \mathbf{0}_{n} 0 n 라 나타내자.
스펙트럴 분해 : 스펙트럴 이론 에서 말하는 A = Q Λ Q ∗ A = Q \Lambda Q^{\ast} A = Q Λ Q ∗ 를 다음과 같이 고유쌍 { ( λ k , e k ) } k = 1 n \left\{ \left( \lambda_{k} , e_{k} \right) \right\}_{k=1}^{n} { ( λ k , e k ) } k = 1 n 들의 급수꼴로 나타낸 것을 스펙트럴 분해 spectral decomposition 이라 한다.
A = ∑ k = 1 n λ k e k e k ∗
A = \sum_{k=1}^{n} \lambda_{k} e_{k} e_{k}^{\ast}
A = k = 1 ∑ n λ k e k e k ∗
A A A 는 대칭행렬 이므로 Q Q Q 는 스텍트럴 분해를 통해 다음과 같이 나타낼 수 있다.
Q = σ − 2 X T A X = σ − 2 X T ∑ i = 1 n λ i e i e i T X = ∑ i = 1 r λ i ( X T e i σ − 1 ) ( σ − 1 e i T X ) = ∑ i = 1 r λ i ( σ − 1 e i T X ) T ( σ − 1 e i T X ) = ∑ i = 1 r λ i ( σ − 1 e i T X ) 2
\begin{align*}
Q =& \sigma^{-2} \mathbf{X}^{T} A \mathbf{X}
\\ =& \sigma^{-2} \mathbf{X}^{T} \sum_{i=1}^{n} \lambda_{i} e_{i} e_{i}^{T} \mathbf{X}
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \mathbf{X}^{T} e_{i} \sigma^{-1} \right) \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{T} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{2}
\end{align*}
Q = = = = = σ − 2 X T A X σ − 2 X T i = 1 ∑ n λ i e i e i T X i = 1 ∑ r λ i ( X T e i σ − 1 ) ( σ − 1 e i T X ) i = 1 ∑ r λ i ( σ − 1 e i T X ) T ( σ − 1 e i T X ) i = 1 ∑ r λ i ( σ − 1 e i T X ) 2
Γ 1 : = ( e 1 T , ⋯ , e r T ) ∈ R r × n \Gamma_{1} := \left( e_{1}^{T} , \cdots , e_{r}^{T} \right) \in \mathbb{R}^{r \times n} Γ 1 := ( e 1 T , ⋯ , e r T ) ∈ R r × n 라 두고 랜덤벡터 W \mathbf{W} W 를 W = σ − 1 Γ 1 X \mathbf{W} = \sigma^{-1} \Gamma_{1} \mathbf{X} W = σ − 1 Γ 1 X 라 두면 W = ( W 1 , ⋯ , W r ) \mathbf{W} = \left( W_{1} , \cdots , W_{r} \right) W = ( W 1 , ⋯ , W r ) 는 r r r 차원 랜덤벡터가 된다.
[ W 1 ⋮ W r ] = W = σ − 1 Γ 1 X = [ σ − 1 e 1 T X ⋮ σ − 1 e n T X ]
\begin{bmatrix} W_{1} \\ \vdots \\ W_{r} \end{bmatrix} = \mathbf{W} = \sigma^{-1} \Gamma_{1} \mathbf{X} = \begin{bmatrix} \sigma^{-1} e_{1}^{T} \mathbf{X} \\ \vdots \\ \sigma^{-1} e_{n}^{T} \mathbf{X} \end{bmatrix}
W 1 ⋮ W r = W = σ − 1 Γ 1 X = σ − 1 e 1 T X ⋮ σ − 1 e n T X
이에 따라 Q Q Q 는 다음과 같이 표현할 수 있다.
Q = ∑ i = 1 r λ i ( σ − 1 e i T X ) 2 = ∑ i = 1 r λ i W i 2
Q = \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{2} = \sum_{i=1}^{r} \lambda_{i} W_{i}^{2}
Q = i = 1 ∑ r λ i ( σ − 1 e i T X ) 2 = i = 1 ∑ r λ i W i 2
한편 랜덤벡터 X \mathbf{X} X 의 각 성분이 정규분포 N ( 0 , σ 2 ) N \left( 0 , \sigma^{2} \right) N ( 0 , σ 2 ) 를 따르므로 X \mathbf{X} X 는 다변량정규분포 N n ( 0 n , σ 2 I n ) N_{n} \left( \mathbf{0}_{n} , \sigma^{2} I_{n} \right) N n ( 0 n , σ 2 I n ) 을 따르고, Γ 1 \Gamma_{1} Γ 1 의 정의 그 자체에서 Γ 1 Γ 1 T = I r \Gamma_{1} \Gamma_{1}^{T} = I_{r} Γ 1 Γ 1 T = I r 이다.
다변량정규분포의 선형변환의 정규성 : 행렬 A ∈ R m × n A \in \mathbb{R}^{m \times n} A ∈ R m × n 과 벡터 b ∈ R m \mathbf{b} \in \mathbb{R}^{m} b ∈ R m 에 대해 다변량정규분포 를 따르는 랜덤벡터 X ∼ N n ( μ , Σ ) \mathbf{X} \sim N_{n} \left( \mu , \Sigma \right) X ∼ N n ( μ , Σ ) 의 선형변환 Y = A X + b \mathbf{Y} = A \mathbf{X} + \mathbf{b} Y = A X + b 는 여전히 다변량정규분포 N m ( A μ + b , A Σ A T ) N_{m} \left( A \mu + \mathbf{b} , A \Sigma A^{T} \right) N m ( A μ + b , A Σ A T ) 를 따른다.
다변량정규분포의 선형변환의 정규성에 따라, W \mathbf{W} W 는 다음과 같이 r r r 차원 다변량정균분포 N r ( 0 r , I r ) N_{r} \left( \mathbf{0}_{r} , I_{r} \right) N r ( 0 r , I r ) 을 따름을 알 수 있다.
W = σ − 1 Γ 1 X + 0 r ⟹ W ∼ N r ( σ − 1 Γ 1 0 n + 0 r , ( σ − 1 Γ 1 ) ( σ 2 I n ) ( σ − 1 Γ 1 ) T ) ⟹ W ∼ N r ( 0 r + 0 r , Γ 1 I n Γ 1 T ) ⟹ W ∼ N r ( 0 r , I r )
\begin{align*}
\mathbf{W} =& \sigma^{-1} \Gamma_{1} \mathbf{X} + \mathbf{0}_{r}
\\ \implies \mathbf{W} \sim & N_{r} \left( \sigma^{-1} \Gamma_{1} \mathbf{0}_{n} + \mathbf{0}_{r} , \left( \sigma^{-1} \Gamma_{1} \right) \left( \sigma^{2} I_{n} \right) \left( \sigma^{-1} \Gamma_{1} \right)^{T} \right)
\\ \implies \mathbf{W} \sim & N_{r} \left( \mathbf{0}_{r} + \mathbf{0}_{r} , \Gamma_{1} I_{n} \Gamma_{1}^{T} \right)
\\ \implies \mathbf{W} \sim & N_{r} \left( \mathbf{0}_{r} , I_{r} \right)
\end{align*}
W = ⟹ W ∼ ⟹ W ∼ ⟹ W ∼ σ − 1 Γ 1 X + 0 r N r ( σ − 1 Γ 1 0 n + 0 r , ( σ − 1 Γ 1 ) ( σ 2 I n ) ( σ − 1 Γ 1 ) T ) N r ( 0 r + 0 r , Γ 1 I n Γ 1 T ) N r ( 0 r , I r )
표준정규분포에서의 카이제곱분포 유도 : X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma ^2) X ∼ N ( μ , σ 2 ) 면
V = ( X − μ σ ) 2 ∼ χ 2 ( 1 )
V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)
V = ( σ X − μ ) 2 ∼ χ 2 ( 1 )
이는 W \mathbf{W} W 의 성분 W 1 , ⋯ , W r W_{1} , \cdots , W_{r} W 1 , ⋯ , W r 이 모두 iid 로 표준정규분포 를 따른다는 것이고, W i 2 W_{i}^{2} W i 2 는 카이제곱분포 χ 2 ( 1 ) \chi^{2} (1) χ 2 ( 1 ) 을 따른다.
카이제곱 분포의 적률 생성 함수 : 자유도 r r r 인 카이제곱분포를 따르는 확률변수의 적률생성함수 는 다음과 같다.
m ( t ) = ( 1 − 2 t ) − r / 2 , t < 1 2 m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }} m ( t ) = ( 1 − 2 t ) − r /2 , t < 2 1
Q Q Q 는 카이제곱분포를 따르는 확률변수 들의 선형결합 이므로 그 적률생성함수 는 다음과 같다.
M Q ( t ) = E [ exp ( t Q ) ] = E [ t exp ( ∑ i = 1 r λ i W i 2 ) ] = ∏ i = 1 r E [ exp ( t λ i W i 2 ) ] = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 , ∣ t ∣ < 1 / 2 λ 1
\begin{align*}
& M_{Q} (t)
\\ =& E \left[ \exp \left( t Q \right) \right]
\\ =& E \left[ t \exp \left( \sum_{i=1}^{r} \lambda_{i} W_{i}^{2} \right) \right]
\\ =& \prod_{i=1}^{r} E \left[ \exp \left( t \lambda_{i} W_{i}^{2} \right) \right]
\\ =& \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} \qquad , | t | < 1 / 2 \lambda_{1}
\end{align*}
= = = = M Q ( t ) E [ exp ( tQ ) ] E [ t exp ( i = 1 ∑ r λ i W i 2 ) ] i = 1 ∏ r E [ exp ( t λ i W i 2 ) ] i = 1 ∏ r ( 1 − 2 t λ i ) − 1/2 , ∣ t ∣ < 1/2 λ 1
직교행렬의 성질 : 직교행렬의 행렬식은 1 1 1 이거나 − 1 -1 − 1 이다.
마지막으로 직교행렬 Γ 1 \Gamma_{1} Γ 1 의 행렬식은 ± 1 \pm 1 ± 1 인데,
1 = det I n = det Γ 1 T det Γ 1
1 = \det I_{n} = \det \Gamma_{1}^{T} \det \Gamma_{1}
1 = det I n = det Γ 1 T det Γ 1
이므로 1 1 1 이든 − 1 -1 − 1 이든 Γ 1 \Gamma_{1} Γ 1 와 Γ 1 T \Gamma_{1}^{T} Γ 1 T 의 행렬식은 복부호동순이다. 이에 따라 I n − 2 t A I_{n} - 2 t A I n − 2 t A 의 행렬식을 구함으로써 M Q ( t ) M_{Q} (t) M Q ( t ) 의 다른 꼴을 얻을 수 있다.
det ( I n − 2 t A ) = det ( Γ 1 T Γ − 2 t Γ 1 T Λ Γ 1 ) = det ( Γ 1 T ( I n − 2 t Λ ) Γ 1 ) = det Γ 1 T det ( I n − 2 t Λ ) det Γ 1 = ( ± 1 ) ⋅ det ( I n − 2 t Λ ) ⋅ ( ± 1 ) = det ( I n − 2 t Λ ) = det [ 1 − 2 t λ 1 0 ⋯ 0 0 1 − 2 t λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ] = ∏ i = 1 r ( 1 − 2 t λ i ) = [ ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 ] − 2
\begin{align*}
& \det \left( I_{n} - 2 t A \right)
\\ =& \det \left( \Gamma_{1}^{T} \Gamma - 2 t \Gamma_{1}^{T} \Lambda \Gamma_{1} \right)
\\ =& \det \left( \Gamma_{1}^{T} \left( I_{n} - 2 t \Lambda \right) \Gamma_{1} \right)
\\ =& \det \Gamma_{1}^{T} \det \left( I_{n} - 2 t \Lambda \right) \det \Gamma_{1}
\\ =& \left( \pm 1 \right) \cdot \det \left( I_{n} - 2 t \Lambda \right) \cdot \left( \pm 1 \right)
\\ =& \det \left( I_{n} - 2 t \Lambda \right)
\\ =& \det \begin{bmatrix}
1 - 2 t \lambda_{1} & 0 & \cdots & 0
\\ 0 & 1 - 2 t \lambda_{2} & \cdots & 0
\\ \vdots & \vdots & \ddots & \vdots
\\ 0 & 0 & \cdots & 1
\end{bmatrix}
\\ =& \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)
\\ =& \left[ \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} \right]^{-2}
\end{align*}
= = = = = = = = det ( I n − 2 t A ) det ( Γ 1 T Γ − 2 t Γ 1 T Λ Γ 1 ) det ( Γ 1 T ( I n − 2 t Λ ) Γ 1 ) det Γ 1 T det ( I n − 2 t Λ ) det Γ 1 ( ± 1 ) ⋅ det ( I n − 2 t Λ ) ⋅ ( ± 1 ) det ( I n − 2 t Λ ) det 1 − 2 t λ 1 0 ⋮ 0 0 1 − 2 t λ 2 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 1 i = 1 ∏ r ( 1 − 2 t λ i ) [ i = 1 ∏ r ( 1 − 2 t λ i ) − 1/2 ] − 2
양변에 − 2 -2 − 2 승을 취함으로써 증명이 끝난다.
det ( I n − 2 t A ) − 1 / 2 = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2
\det \left( I_{n} - 2 t A \right)^{-1/2} = \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2}
det ( I n − 2 t A ) − 1/2 = i = 1 ∏ r ( 1 − 2 t λ i ) − 1/2
■