수리통계학에서의 델타 메소드
📂수리통계학 수리통계학에서의 델타 메소드 정리 상수 θ ∈ R \theta \in \mathbb{R} θ ∈ R 와 확률변수 의 시퀀스 { Y n } n ∈ N \left\{ Y_{n} \right\}_{n \in \mathbb{N}} { Y n } n ∈ N 에 대해 n ( Y n − θ ) \sqrt{n} \left( Y_{n} - \theta \right) n ( Y n − θ ) 가 정규분포 N ( 0 , σ 2 ) N \left(0, \sigma^{2} \right) N ( 0 , σ 2 ) 로 분포수렴 한다고 하자.
1 1 1 계 델타 메소드 g ′ ( θ ) ≠ 0 g ' (\theta) \ne 0 g ′ ( θ ) = 0 이 존재한다면,
n [ g ( Y n ) − g ( θ ) ] → D N ( 0 , σ 2 [ g ′ ( θ ) ] 2 )
\sqrt{n} \left[ g \left( Y_{n} \right) - g(\theta) \right] \overset{D}{\to} N \left( 0, \sigma^{2} \left[ g ' (\theta) \right]^{2} \right)
n [ g ( Y n ) − g ( θ ) ] → D N ( 0 , σ 2 [ g ′ ( θ ) ] 2 )
2 2 2 계 델타 메소드 g ′ ( θ ) = 0 g ' (\theta) = 0 g ′ ( θ ) = 0 이고 g ′ ′ ( θ ) ≠ 0 g''(\theta) \ne 0 g ′′ ( θ ) = 0 이 존재한다면,
n [ g ( Y n ) − g ( θ ) ] → D σ 2 g ′ ′ ( θ ) 2 χ 1 2
n \left[ g \left( Y_{n} \right) - g(\theta) \right] \overset{D}{\to} \sigma^{2} {{ g''\left( \theta \right) } \over { 2 }} \chi_{1}^{2}
n [ g ( Y n ) − g ( θ ) ] → D σ 2 2 g ′′ ( θ ) χ 1 2
일반화된 델타 메소드 n n n 에 종속된 어떤 k n k_{n} k n 에 대해 k n ( Y n − θ ) → D Y k_{n} \left( Y_{n} - \theta \right) \overset{D}{\to} Y k n ( Y n − θ ) → D Y 라고 하자. 만약
k ∈ [ r − 1 ] k \in [r-1] k ∈ [ r − 1 ] 에 대해 g ( k ) ( θ ) = 0 g^{(k)} (\theta) = 0 g ( k ) ( θ ) = 0 g ( r ) ( θ ) ≠ 0 g^{(r)} (\theta) \ne 0 g ( r ) ( θ ) = 0 가 존재g ( r ) g^{(r)} g ( r ) 가 θ \theta θ 에서 연속이라면,
k n r [ g ( Y n ) − g ( θ ) ] → D g ( r ) ( θ ) r ! Y r
k_{n}^{r} \left[ g \left( Y_{n} \right) - g (\theta) \right] \overset{D}{\to} {{ g^{(r)} (\theta) } \over { r! }} Y^{r}
k n r [ g ( Y n ) − g ( θ ) ] → D r ! g ( r ) ( θ ) Y r
→ D \overset{D}{\to} → D 는 분포수렴 을 의미한다.χ 1 2 \chi_{1}^{2} χ 1 2 는 카이제곱분포 를 나타낸다.g ( k ) g^{(k)} g ( k ) 는 k k k 계 도함수다.[ r − 1 ] [r-1] [ r − 1 ] 은 r − 1 r-1 r − 1 까지의 자연수를 모아놓은 집합 { 1 , ⋯ , r − 1 } \left\{ 1, \cdots, r-1 \right\} { 1 , ⋯ , r − 1 } 이다.설명 델타 메소드 delta method 는 수리통계학에서 많은 분포수렴을 설명하는 보조정리로써 폭넓게 쓰인다.
예제 가령 X X X 의 평균과 분산을 알고 있을 때,
g ( X ) = g ( μ ) + g ′ ( μ ) ( X − μ )
g(X) = g (\mu) + g ' (\mu) \left( X - \mu \right)
g ( X ) = g ( μ ) + g ′ ( μ ) ( X − μ )
이면
E g ( X ) ≈ g ( μ ) Var g ( X ) ≈ [ g ′ ( μ ) ] 2 Var X
\begin{align*}
E g(X) \approx & g (\mu)
\\ \operatorname{Var} g (X) \approx & \left[ g ' (\mu) \right]^2 \operatorname{Var} X
\end{align*}
E g ( X ) ≈ Var g ( X ) ≈ g ( μ ) [ g ′ ( μ ) ] 2 Var X
다. 만약 원래 X X X 의 역수에 대한 평균과 분산이 궁금하다면 함수 g ( x ) : = 1 / x g(x) := 1/x g ( x ) := 1/ x 에 대해 다음과 같은 결과를 얻어낼 수 있다.
E 1 X ≈ 1 μ Var 1 X ≈ [ 1 μ ] 4 Var X
\begin{align*}
E {{ 1 } \over { X }} \approx & {{ 1 } \over { \mu }}
\\ \operatorname{Var} {{ 1 } \over { X }} \approx & \left[ {{ 1 } \over { \mu }} \right]^{4} \operatorname{Var} X
\end{align*}
E X 1 ≈ Var X 1 ≈ μ 1 [ μ 1 ] 4 Var X
물론 이것이 정확한 델타 메소드의 결과는 아니지만, 확률변수의 함수꼴을 다룰 수 있게 도와주는 도구로써 언제나 델타 메소드를 떠올릴 수 있어야한다.
증명 전략: 사실상 테일러전개 와 슬러츠키 정리에서 끝난다.
슬러츠키 정리 : 상수 a , b a,b a , b 와 확률 변수 A n , B n , X n , X A_{n}, B_{n} ,X_{n} , X A n , B n , X n , X 에 대해 a n → P a a_{n} \overset{P}{\to} a a n → P a , B n → P b B_{n} \overset{P}{\to} b B n → P b , X n → D X X_{n} \overset{D}{\to} X X n → D X 면
A n + B n X n → D a + b X
A_{n} + B_{n} X_{n} \overset{D}{\to} a + b X
A n + B n X n → D a + b X
일반화된 델타 메소드의 증명은 생략한다.
1 1 1 계 델타 메소드의 증명Y n = θ Y_{n} = \theta Y n = θ 근방에서 g ( Y n ) g \left( Y_{n} \right) g ( Y n ) 은 lim Y n → θ R → 0 \lim_{Y_{n} \to \theta} R \to 0 lim Y n → θ R → 0 인 나머지항 R R R 에 대해
g ( Y n ) = g ( θ ) + g ′ ( θ ) ( Y n − θ ) + R
g \left( Y_{n} \right) = g (\theta) + g ' (\theta) \left( Y_{n} - \theta \right) + R
g ( Y n ) = g ( θ ) + g ′ ( θ ) ( Y n − θ ) + R
이다. g ( θ ) g(\theta) g ( θ ) 를 좌변으로 넘기고 n \sqrt{n} n 을 곱하면
n [ g ( Y n ) − g ( θ ) ] ≈ g ′ ( θ ) n ( Y n − θ )
\sqrt{n} \left[ g \left( Y_{n} \right) - g(\theta) \right] \approx g ' (\theta) \sqrt{n} \left( Y_{n} - \theta \right)
n [ g ( Y n ) − g ( θ ) ] ≈ g ′ ( θ ) n ( Y n − θ )
고, 슬러츠키 정리에 따라 증명이 끝난다.
■
2 2 2 계 델타 메소드의 증명마찬가지로 Y n = θ Y_{n} = \theta Y n = θ 근방에서 g ( Y n ) g \left( Y_{n} \right) g ( Y n ) 은 lim Y n → θ R → 0 \lim_{Y_{n} \to \theta} R \to 0 lim Y n → θ R → 0 인 나머지항 R R R 에 대해
g ( Y n ) = g ( θ ) + g ′ ( θ ) ( Y n − θ ) + g ′ ′ ( θ ) 2 ( Y n − θ ) 2 + R = g ( θ ) + 0 ⋅ ( Y n − θ ) + σ 2 σ 2 g ′ ′ ( θ ) 2 ( Y n − θ ) 2 + R
\begin{align*}
g \left( Y_{n} \right) =& g (\theta) + g ' (\theta) \left( Y_{n} - \theta \right) + {{ g''(\theta) } \over { 2 }} \left( Y_{n} - \theta \right)^{2} + R
\\ =& g (\theta) + 0 \cdot \left( Y_{n} - \theta \right) + {{ \sigma^{2} } \over { \sigma^{2} }} {{ g''(\theta) } \over { 2 }} \left( Y_{n} - \theta \right)^{2} + R
\end{align*}
g ( Y n ) = = g ( θ ) + g ′ ( θ ) ( Y n − θ ) + 2 g ′′ ( θ ) ( Y n − θ ) 2 + R g ( θ ) + 0 ⋅ ( Y n − θ ) + σ 2 σ 2 2 g ′′ ( θ ) ( Y n − θ ) 2 + R
이다. 역시 g ( θ ) g(\theta) g ( θ ) 를 좌변으로 넘기고 n n n 을 곱하면
n [ g ( Y n ) − g ( θ ) ] ≈ σ 2 g ′ ′ ( θ ) 2 ( Y n − θ ) 2 σ 2 / n
n \left[ g \left( Y_{n} \right) - g (\theta) \right] \approx \sigma^{2} {{ g''(\theta) } \over { 2 }} {{ \left( Y_{n} - \theta \right)^{2} } \over { \sigma^{2}/n }}
n [ g ( Y n ) − g ( θ ) ] ≈ σ 2 2 g ′′ ( θ ) σ 2 / n ( Y n − θ ) 2
고, 표준정규분포의 제곱인 ( Y n − θ ) 2 σ 2 / n {{ \left( Y_{n} - \theta \right)^{2} } \over { \sigma^{2}/n }} σ 2 / n ( Y n − θ ) 2 가 카이제곱분포 χ 1 2 \chi_{1}^{2} χ 1 2 로 분포 수렴해 슬러츠키 정리에 따라 증명이 끝난다.
■