정규분포 랜덤벡터 이차형식의 적률생성함수 
📂수리통계학 정규분포 랜덤벡터 이차형식의 적률생성함수 정리 샘플  X = ( X 1 , ⋯  , X n ) \mathbf{X} = \left( X_{1} , \cdots , X_{n} \right) X = ( X 1  , ⋯ , X n  ) X 1 , ⋯  , X n ∼ iid N ( 0 , σ 2 ) X_{1} , \cdots , X_{n} \overset{\text{iid}}{\sim} N \left( 0, \sigma^{2} \right) X 1  , ⋯ , X n  ∼ iid N ( 0 , σ 2 ) iid 로 정규분포 를 따른다고 하자. 랭크 가 r ≤ n r \le n r ≤ n 대칭행렬  A ∈ R n × n A \in \mathbb{R}^{n \times n} A ∈ R n × n 랜덤벡터 이차형식  Q = σ − 2 X T A X Q = \sigma^{-2} \mathbf{X}^{T} A \mathbf{X} Q = σ − 2 X T A X 적률생성함수 는 다음과 같다.
M Q ( t ) = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 = det  ( I n − 2 t A ) − 1 / 2 , ∣ t ∣ < 1 / 2 λ 1 
M_{Q} (t) = \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} = \det \left( I_{n} - 2 t A \right)^{-1/2} \qquad , | t | < 1 / 2 \lambda_{1}
 M Q  ( t ) = i = 1 ∏ r  ( 1 − 2 t λ i  ) − 1/2 = det ( I n  − 2 t A ) − 1/2 , ∣ t ∣ < 1/2 λ 1  I n ∈ R n × n I_{n} \in \mathbb{R}^{n \times n} I n  ∈ R n × n 항등행렬 , det  \det det 행렬식 이다. λ 1 ≥ ⋯ ≥ λ r \lambda_{1} \ge \cdots \ge \lambda_{r} λ 1  ≥ ⋯ ≥ λ r  A A A 0 0 0 고유값 을 일반성을 잃지 않고  내림차순으로 나열한 것이다.
설명 이 정리는 호그-크레이그 정리의 증명 에 쓰인다.
증명  n n n 영벡터 를 0 n \mathbf{0}_{n} 0 n  
스펙트럴 분해 : 스펙트럴 이론 에서 말하는 A = Q Λ Q ∗ A = Q \Lambda Q^{\ast} A = Q Λ Q ∗ 고유쌍  { ( λ k , e k ) } k = 1 n \left\{ \left( \lambda_{k} , e_{k} \right) \right\}_{k=1}^{n} { ( λ k  , e k  ) } k = 1 n  스펙트럴 분해 spectral decomposition 이라 한다.
A = ∑ k = 1 n λ k e k e k ∗ 
A = \sum_{k=1}^{n} \lambda_{k} e_{k} e_{k}^{\ast}
 A = k = 1 ∑ n  λ k  e k  e k ∗  
A A A 대칭행렬 이므로 Q Q Q Q = σ − 2 X T A X = σ − 2 X T ∑ i = 1 n λ i e i e i T X = ∑ i = 1 r λ i ( X T e i σ − 1 ) ( σ − 1 e i T X ) = ∑ i = 1 r λ i ( σ − 1 e i T X ) T ( σ − 1 e i T X ) = ∑ i = 1 r λ i ( σ − 1 e i T X ) 2 
\begin{align*}
Q =& \sigma^{-2} \mathbf{X}^{T} A \mathbf{X}
\\ =& \sigma^{-2} \mathbf{X}^{T} \sum_{i=1}^{n} \lambda_{i} e_{i} e_{i}^{T} \mathbf{X}
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \mathbf{X}^{T} e_{i} \sigma^{-1} \right) \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{T} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)
\\ =& \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{2}
\end{align*}
 Q = = = = =  σ − 2 X T A X σ − 2 X T i = 1 ∑ n  λ i  e i  e i T  X i = 1 ∑ r  λ i  ( X T e i  σ − 1 ) ( σ − 1 e i T  X ) i = 1 ∑ r  λ i  ( σ − 1 e i T  X ) T ( σ − 1 e i T  X ) i = 1 ∑ r  λ i  ( σ − 1 e i T  X ) 2  Γ 1 : = ( e 1 T , ⋯  , e r T ) ∈ R r × n \Gamma_{1} := \left( e_{1}^{T} , \cdots , e_{r}^{T} \right) \in \mathbb{R}^{r \times n} Γ 1  := ( e 1 T  , ⋯ , e r T  ) ∈ R r × n 랜덤벡터  W \mathbf{W} W W = σ − 1 Γ 1 X \mathbf{W} = \sigma^{-1} \Gamma_{1} \mathbf{X} W = σ − 1 Γ 1  X W = ( W 1 , ⋯  , W r ) \mathbf{W} = \left( W_{1} , \cdots , W_{r} \right) W = ( W 1  , ⋯ , W r  ) r r r [ W 1 ⋮ W r ] = W = σ − 1 Γ 1 X = [ σ − 1 e 1 T X ⋮ σ − 1 e n T X ] 
\begin{bmatrix} W_{1} \\ \vdots \\ W_{r} \end{bmatrix} = \mathbf{W} = \sigma^{-1} \Gamma_{1} \mathbf{X} = \begin{bmatrix} \sigma^{-1} e_{1}^{T} \mathbf{X} \\ \vdots \\ \sigma^{-1} e_{n}^{T} \mathbf{X} \end{bmatrix}
  W 1  ⋮ W r    = W = σ − 1 Γ 1  X =  σ − 1 e 1 T  X ⋮ σ − 1 e n T  X   Q Q Q Q = ∑ i = 1 r λ i ( σ − 1 e i T X ) 2 = ∑ i = 1 r λ i W i 2 
Q = \sum_{i=1}^{r} \lambda_{i} \left( \sigma^{-1} e_{i}^{T} \mathbf{X} \right)^{2} = \sum_{i=1}^{r} \lambda_{i} W_{i}^{2}
 Q = i = 1 ∑ r  λ i  ( σ − 1 e i T  X ) 2 = i = 1 ∑ r  λ i  W i 2  
한편 랜덤벡터 X \mathbf{X} X N ( 0 , σ 2 ) N \left( 0 , \sigma^{2} \right) N ( 0 , σ 2 ) X \mathbf{X} X 다변량정규분포  N n ( 0 n , σ 2 I n ) N_{n} \left( \mathbf{0}_{n} , \sigma^{2} I_{n} \right) N n  ( 0 n  , σ 2 I n  ) Γ 1 \Gamma_{1} Γ 1  Γ 1 Γ 1 T = I r \Gamma_{1} \Gamma_{1}^{T} = I_{r} Γ 1  Γ 1 T  = I r  
다변량정규분포의 선형변환의 정규성 : 행렬  A ∈ R m × n A \in \mathbb{R}^{m \times n} A ∈ R m × n 벡터  b ∈ R m \mathbf{b} \in \mathbb{R}^{m} b ∈ R m 다변량정규분포 를 따르는 랜덤벡터  X ∼ N n ( μ , Σ ) \mathbf{X} \sim N_{n} \left( \mu , \Sigma \right) X ∼ N n  ( μ , Σ ) 선형변환  Y = A X + b \mathbf{Y} = A \mathbf{X} + \mathbf{b} Y = A X + b N m ( A μ + b , A Σ A T ) N_{m} \left( A \mu + \mathbf{b} , A \Sigma A^{T} \right) N m  ( A μ + b , A Σ A T ) 
다변량정규분포의 선형변환의 정규성에 따라, W \mathbf{W} W r r r N r ( 0 r , I r ) N_{r} \left( \mathbf{0}_{r} , I_{r} \right) N r  ( 0 r  , I r  ) W = σ − 1 Γ 1 X + 0 r   ⟹   W ∼  N r ( σ − 1 Γ 1 0 n + 0 r , ( σ − 1 Γ 1 ) ( σ 2 I n ) ( σ − 1 Γ 1 ) T )   ⟹   W ∼  N r ( 0 r + 0 r , Γ 1 I n Γ 1 T )   ⟹   W ∼  N r ( 0 r , I r ) 
\begin{align*}
\mathbf{W} =& \sigma^{-1} \Gamma_{1} \mathbf{X} + \mathbf{0}_{r}
\\ \implies \mathbf{W} \sim & N_{r} \left( \sigma^{-1} \Gamma_{1} \mathbf{0}_{n} + \mathbf{0}_{r} , \left( \sigma^{-1} \Gamma_{1} \right) \left( \sigma^{2} I_{n} \right) \left( \sigma^{-1} \Gamma_{1} \right)^{T} \right)
\\ \implies \mathbf{W} \sim & N_{r} \left( \mathbf{0}_{r} + \mathbf{0}_{r} , \Gamma_{1} I_{n} \Gamma_{1}^{T} \right)
\\ \implies \mathbf{W} \sim & N_{r} \left( \mathbf{0}_{r} , I_{r} \right)
\end{align*}
 W = ⟹ W ∼ ⟹ W ∼ ⟹ W ∼  σ − 1 Γ 1  X + 0 r  N r  ( σ − 1 Γ 1  0 n  + 0 r  , ( σ − 1 Γ 1  ) ( σ 2 I n  ) ( σ − 1 Γ 1  ) T ) N r  ( 0 r  + 0 r  , Γ 1  I n  Γ 1 T  ) N r  ( 0 r  , I r  )  
표준정규분포에서의 카이제곱분포 유도 : X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma ^2) X ∼ N ( μ , σ 2 ) V = ( X − μ σ ) 2 ∼ χ 2 ( 1 ) 
V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)
 V = ( σ X − μ  ) 2 ∼ χ 2 ( 1 ) 
이는 W \mathbf{W} W W 1 , ⋯  , W r W_{1} , \cdots , W_{r} W 1  , ⋯ , W r  iid 로 표준정규분포 를 따른다는 것이고, W i 2 W_{i}^{2} W i 2  카이제곱분포  χ 2 ( 1 ) \chi^{2} (1) χ 2 ( 1 ) 
카이제곱 분포의 적률 생성 함수 : 자유도  r r r 적률생성함수 는 다음과 같다.
m ( t ) = ( 1 − 2 t ) − r / 2 , t < 1 2 m(t) = (1-2t)^{-r/2} \qquad , t < {{ 1 } \over { 2 }} m ( t ) = ( 1 − 2 t ) − r /2 , t < 2 1  
Q Q Q 확률변수 들의 선형결합 이므로 그 적률생성함수 는 다음과 같다.
M Q ( t ) = E [ exp  ( t Q ) ] = E [ t exp  ( ∑ i = 1 r λ i W i 2 ) ] = ∏ i = 1 r E [ exp  ( t λ i W i 2 ) ] = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 , ∣ t ∣ < 1 / 2 λ 1 
\begin{align*}
& M_{Q} (t)
\\ =& E \left[ \exp \left( t Q \right) \right]
\\ =& E \left[ t \exp \left( \sum_{i=1}^{r} \lambda_{i} W_{i}^{2} \right) \right]
\\ =& \prod_{i=1}^{r} E \left[ \exp \left( t \lambda_{i} W_{i}^{2} \right) \right]
\\ =& \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} \qquad , | t | < 1 / 2 \lambda_{1}
\end{align*}
 = = = =  M Q  ( t ) E [ exp ( tQ ) ] E [ t exp ( i = 1 ∑ r  λ i  W i 2  ) ] i = 1 ∏ r  E [ exp ( t λ i  W i 2  ) ] i = 1 ∏ r  ( 1 − 2 t λ i  ) − 1/2 , ∣ t ∣ < 1/2 λ 1   
직교행렬의 성질 : 직교행렬의 행렬식은 1 1 1 − 1 -1 − 1 
마지막으로 직교행렬 Γ 1 \Gamma_{1} Γ 1  ± 1 \pm 1 ± 1 1 = det  I n = det  Γ 1 T det  Γ 1 
1 = \det I_{n} = \det \Gamma_{1}^{T} \det \Gamma_{1}
 1 = det I n  = det Γ 1 T  det Γ 1  1 1 1 − 1 -1 − 1 Γ 1 \Gamma_{1} Γ 1  Γ 1 T \Gamma_{1}^{T} Γ 1 T  I n − 2 t A I_{n} - 2 t A I n  − 2 t A M Q ( t ) M_{Q} (t) M Q  ( t ) det  ( I n − 2 t A ) = det  ( Γ 1 T Γ − 2 t Γ 1 T Λ Γ 1 ) = det  ( Γ 1 T ( I n − 2 t Λ ) Γ 1 ) = det  Γ 1 T det  ( I n − 2 t Λ ) det  Γ 1 = ( ± 1 ) ⋅ det  ( I n − 2 t Λ ) ⋅ ( ± 1 ) = det  ( I n − 2 t Λ ) = det  [ 1 − 2 t λ 1 0 ⋯ 0 0 1 − 2 t λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ] = ∏ i = 1 r ( 1 − 2 t λ i ) = [ ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 ] − 2 
\begin{align*}
& \det \left( I_{n} - 2 t A \right)
\\ =& \det \left( \Gamma_{1}^{T} \Gamma - 2 t \Gamma_{1}^{T} \Lambda \Gamma_{1} \right)
\\ =& \det \left( \Gamma_{1}^{T} \left( I_{n} - 2 t \Lambda \right) \Gamma_{1} \right)
\\ =& \det \Gamma_{1}^{T} \det \left( I_{n} - 2 t \Lambda \right) \det \Gamma_{1}
\\ =& \left( \pm 1 \right) \cdot \det \left( I_{n} - 2 t \Lambda \right) \cdot \left( \pm 1 \right)
\\ =& \det \left( I_{n} - 2 t \Lambda \right)
\\ =& \det \begin{bmatrix}
1 - 2 t \lambda_{1} & 0 & \cdots & 0
\\ 0 & 1 - 2 t \lambda_{2} & \cdots & 0
\\ \vdots & \vdots & \ddots & \vdots
\\ 0 & 0 & \cdots & 1
\end{bmatrix}
\\ =& \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)
\\ =& \left[ \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2} \right]^{-2}
\end{align*}
 = = = = = = = =  det ( I n  − 2 t A ) det ( Γ 1 T  Γ − 2 t Γ 1 T  Λ Γ 1  ) det ( Γ 1 T  ( I n  − 2 t Λ ) Γ 1  ) det Γ 1 T  det ( I n  − 2 t Λ ) det Γ 1  ( ± 1 ) ⋅ det ( I n  − 2 t Λ ) ⋅ ( ± 1 ) det ( I n  − 2 t Λ ) det  1 − 2 t λ 1  0 ⋮ 0  0 1 − 2 t λ 2  ⋮ 0  ⋯ ⋯ ⋱ ⋯  0 0 ⋮ 1   i = 1 ∏ r  ( 1 − 2 t λ i  ) [ i = 1 ∏ r  ( 1 − 2 t λ i  ) − 1/2 ] − 2  − 2 -2 − 2 det  ( I n − 2 t A ) − 1 / 2 = ∏ i = 1 r ( 1 − 2 t λ i ) − 1 / 2 
\det \left( I_{n} - 2 t A \right)^{-1/2} = \prod_{i=1}^{r} \left( 1 - 2 t \lambda_{i} \right)^{-1/2}
 det ( I n  − 2 t A ) − 1/2 = i = 1 ∏ r  ( 1 − 2 t λ i  ) − 1/2 
■