t-분포
📂확률분포론 t-분포 정의
자유도 ν > 0 \nu > 0 ν > 0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 t ( ν ) t \left( \nu \right) t ( ν ) 를 t-분포라고 한다.
f ( x ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + x 2 ν ) − ν + 1 2 , x ∈ R
f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}
f ( x ) = ν π Γ ( 2 ν ) Γ ( 2 ν + 1 ) ( 1 + ν x 2 ) − 2 ν + 1 , x ∈ R
Γ ( ν ) \Gamma (\nu) Γ ( ν ) 는 감마 함수 다.설명 t-분포 는 지금도 맥주로 유명한 기네스 양조 공장에서 일하던 윌리엄 고셋 william S. Gosset 이 발견하고 발표해 널리 알려진 분포로써, 당시에는 기업에 묶여있는 몸이었던지라 학생Student라는 필명으로 투고해 스튜던트 t-분포 라 불리기도 한다. 통계학과 신입생의 경우에는 표본이 정규분포를 따른다고 가정은 하지만 실제로는 30개에 못 미치는 소표본일 때 사용하는 분포로써 처음 접하게 된다. ν ≥ 30 \nu \ge 30 ν ≥ 30 일 때는 거의 정규분포에 수렴했다고 본다.
한편, 특히 ν = 1 \nu = 1 ν = 1 일 때의 분포를 코시 분포 라고 한다.
기초 성질 적률 생성 함수 [1]: t t t -분포는 적률 생성 함수가 존재하지 않는다. 평균과 분산 [2]: X ∼ t ( ν ) X \sim t (\nu) X ∼ t ( ν ) 이면
E ( X ) = 0 , ν > 1 Var ( X ) = ν ν − 2 , ν > 2
\begin{align*}
E(X) =& 0 & \qquad , \nu >1
\\ \operatorname{Var}(X) =& {{ \nu } \over { \nu - 2 }} & \qquad , \nu > 2
\end{align*}
E ( X ) = Var ( X ) = 0 ν − 2 ν , ν > 1 , ν > 2 정리 두 확률 변수 W , V W,V W , V 가 독립이고 W ∼ N ( 0 , 1 ) W \sim N(0,1) W ∼ N ( 0 , 1 ) , V ∼ χ 2 ( r ) V \sim \chi^{2} (r) V ∼ χ 2 ( r ) 이라 하자.
k k k 차 적률 [a]: k < r k < r k < r 이면 T : = W V / r \displaystyle T := { {W} \over {\sqrt{V/r} } } T := V / r W 는 k k k 차 적률이 존재하고
E T k = E W k 2 − k / 2 Γ ( r 2 − k 2 ) Γ ( r 2 ) r − k / 2
E T^{k} = E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }}
E T k = E W k Γ ( 2 r ) r − k /2 2 − k /2 Γ ( 2 r − 2 k ) [b]: W V / r ∼ t ( r ) { {W} \over {\sqrt{V/r} } } \sim t(r) V / r W ∼ t ( r ) [c]: T n ∼ t ( n ) T_n \sim t(n) T n ∼ t ( n ) 이면
T n → D N ( 0 , 1 )
T_n \ \overset{D}{\to} N(0,1)
T n → D N ( 0 , 1 ) [d]: 자유도 ν > 0 \nu > 0 ν > 0 인 t-분포 를 따르는 확률변수 X ∼ t ( ν ) X \sim t(\nu) X ∼ t ( ν ) 에 대해 다음과 같이 정의된 Y Y Y 는 F-분포 F ( 1 , ν ) F (1,\nu) F ( 1 , ν ) 을 따른다.
Y : = X 2 ∼ F ( 1 , ν )
Y := X^{2} \sim F (1,\nu)
Y := X 2 ∼ F ( 1 , ν ) N ( μ , σ 2 ) N \left( \mu , \sigma^{2} \right) N ( μ , σ 2 ) 는 평균이 μ \mu μ 고 분산이 σ 2 \sigma^{2} σ 2 인 정규 분포 다.χ 2 ( r ) \chi^{2} \left( r \right) χ 2 ( r ) 은 자유도 r r r 인 카이제곱 분포 다.증명 [1] 확률 변수의 적률 생성 함수가 존재한다는 것은 모든 k ∈ N k \in \mathbb{N} k ∈ N 에 대해 k k k 차 적률이 존재한다는 것이다. 그러나 정리 [a]에서 t-분포의 k k k 차 적률은 k < r k < r k < r 일 때 존재하므로 적률 생성 함수가 존재할 수 없다.
■
[2] 적률공식 [a]를 사용한다.
■
[a] 카이제곱 분포의 적률 : X ∼ χ 2 ( r ) X \sim \chi^{2} (r) X ∼ χ 2 ( r ) 이라고 하자. k > − r / 2 k > - r/ 2 k > − r /2 이면 k k k 차 적률이 존재하고
E X k = 2 k Γ ( r / 2 + k ) Γ ( r / 2 )
E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }}
E X k = Γ ( r /2 ) 2 k Γ ( r /2 + k )
k < r k < r k < r 의 양변에 − 1 / 2 -1/2 − 1/2 를 곱하면 − k / 2 > − r / 2 -k/2 > -r/2 − k /2 > − r /2 이므로
E T k = E [ W k ( V r ) − k / 2 ] = E W k E ( V r ) − k / 2 = E W k 2 − k / 2 Γ ( r 2 − k 2 ) Γ ( r 2 ) r − k / 2
\begin{align*}
E T^{k} =& E \left[ W^{k} \left( {{ V } \over { r }} \right)^{-k/2} \right]
\\ =& E W^{k} E \left( {{ V } \over { r }} \right)^{-k/2}
\\ =& E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }}
\end{align*}
E T k = = = E [ W k ( r V ) − k /2 ] E W k E ( r V ) − k /2 E W k Γ ( 2 r ) r − k /2 2 − k /2 Γ ( 2 r − 2 k )
■
[b] 조인트 밀도함수로 직접연역한다.
■
[c] 확률밀도함수에 스털링 근사를 사용한다.
■
[d] 카이제곱 분포의 비로써 우회한다.
■
코드 다음은 코시분포, t-분포 , 코시분포의 확률밀도함수를 보여주는 줄리아 코드다.
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__ )
x = -4 :0.1 :4
plot(x, pdf.(Cauchy(), x),
color = :red,
label = "Cauchy" , size = (400 ,300 ))
plot!(x, pdf.(TDist(3 ), x),
color = :orange,
label = "t(3)" , size = (400 ,300 ))
plot!(x, pdf.(TDist(30 ), x),
color = :black, linestyle = :dash,
label = "t(30)" , size = (400 ,300 ))
plot!(x, pdf.(Normal(), x),
color = :black,
label = "Standard Normal" , size = (400 ,300 ))
xlims!(-4 ,5 ); ylims!(0 ,0.5 ); title!(L"\mathrm{pdf\,of\, t}(\nu)" )
png("pdf" )