t-分布
📂確率分布論 t-分布 定義
自由度ν > 0 \nu > 0 ν > 0 に対して、次の確率密度関数を持つ連続確率分布 t ( ν ) t \left( \nu \right) t ( ν ) をt-分布という。
f ( x ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + x 2 ν ) − ν + 1 2 , x ∈ R
f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}
f ( x ) = ν π Γ ( 2 ν ) Γ ( 2 ν + 1 ) ( 1 + ν x 2 ) − 2 ν + 1 , x ∈ R
Γ ( ν ) \Gamma (\nu) Γ ( ν ) はガンマ関数 だ。説明 t-分布 は、今でもビールで有名なギネス醸造所で働いていたウィリアム・ゴセット william S. Gosset によって発見され、公表された分布である。その当時、企業に所属していたため、彼は学生 という筆名で投稿し、それが学生t-分布 とも呼ばれるようになった。統計学の新入生は、当初、標本が正規分布に従うと仮定されるが、実際には30個に達しない小さなサンプルで使用される分布に最初に遭遇する。ν ≥ 30 \nu \ge 30 ν ≥ 30 のときは、ほぼ正規分布に収束したとみなされる。
一方、特にν = 1 \nu = 1 ν = 1 のときの分布はコーシー分布 と呼ばれる。
基本的な性質 モーメント生成関数 平均と分散 [2]: X ∼ t ( ν ) X \sim t (\nu) X ∼ t ( ν ) であれば
E ( X ) = 0 , ν > 1 Var ( X ) = ν ν − 2 , ν > 2
\begin{align*}
E(X) =& 0 & \qquad , \nu >1
\\ \operatorname{Var}(X) =& {{ \nu } \over { \nu - 2 }} & \qquad , \nu > 2
\end{align*}
E ( X ) = Var ( X ) = 0 ν − 2 ν , ν > 1 , ν > 2 定理 二つの確率変数W , V W,V W , V が独立であり、W ∼ N ( 0 , 1 ) W \sim N(0,1) W ∼ N ( 0 , 1 ) 、V ∼ χ 2 ( r ) V \sim \chi^{2} (r) V ∼ χ 2 ( r ) であるとする。
[a]: k < r k < r k < r であればT : = W V / r \displaystyle T := { {W} \over {\sqrt{V/r} } } T := V / r W はk k k 次のモーメントが存在し
E T k = E W k 2 − k / 2 Γ ( r 2 − k 2 ) Γ ( r 2 ) r − k / 2
E T^{k} = E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }}
E T k = E W k Γ ( 2 r ) r − k /2 2 − k /2 Γ ( 2 r − 2 k ) [b]: W V / r ∼ t ( r ) { {W} \over {\sqrt{V/r} } } \sim t(r) V / r W ∼ t ( r ) [c]: T n ∼ t ( n ) T_n \sim t(n) T n ∼ t ( n ) であれば
T n → D N ( 0 , 1 )
T_n \ \overset{D}{\to} N(0,1)
T n → D N ( 0 , 1 ) [d]: 自由度ν > 0 \nu > 0 ν > 0 のt-分布 に従う確率変数X ∼ t ( ν ) X \sim t(\nu) X ∼ t ( ν ) について、次のように定義されたY Y Y はF分布 F ( 1 , ν ) F (1,\nu) F ( 1 , ν ) に従う。
Y : = X 2 ∼ F ( 1 , ν )
Y := X^{2} \sim F (1,\nu)
Y := X 2 ∼ F ( 1 , ν ) N ( μ , σ 2 ) N \left( \mu , \sigma^{2} \right) N ( μ , σ 2 ) は平均がμ \mu μ で分散がσ 2 \sigma^{2} σ 2 の正規分布 だ。χ 2 ( r ) \chi^{2} \left( r \right) χ 2 ( r ) は自由度r r r のカイ二乗分布 だ。証明 確率変数のモーメント生成関数が存在するとは、すべてのk ∈ N k \in \mathbb{N} k ∈ N に対してk k k 次のモーメントが存在することを意味する。しかし、定理[a]によれば、t分布のk k k 次モーメントはk < r k < r k < r のときに存在するため、モーメント生成関数は存在しない。
■
[2] モーメント公式[a]を使用する。
■
[a] カイ二乗分布のモーメント : X ∼ χ 2 ( r ) X \sim \chi^{2} (r) X ∼ χ 2 ( r ) とする。k > − r / 2 k > - r/ 2 k > − r /2 であればk k k 次モーメントが存在し
E X k = 2 k Γ ( r / 2 + k ) Γ ( r / 2 )
E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }}
E X k = Γ ( r /2 ) 2 k Γ ( r /2 + k )
k < r k < r k < r の両辺に− 1 / 2 -1/2 − 1/2 を掛けると− k / 2 > − r / 2 -k/2 > -r/2 − k /2 > − r /2 となるので
E T k = E [ W k ( V r ) − k / 2 ] = E W k E ( V r ) − k / 2 = E W k 2 − k / 2 Γ ( r 2 − k 2 ) Γ ( r 2 ) r − k / 2
\begin{align*}
E T^{k} =& E \left[ W^{k} \left( {{ V } \over { r }} \right)^{-k/2} \right]
\\ =& E W^{k} E \left( {{ V } \over { r }} \right)^{-k/2}
\\ =& E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }}
\end{align*}
E T k = = = E [ W k ( r V ) − k /2 ] E W k E ( r V ) − k /2 E W k Γ ( 2 r ) r − k /2 2 − k /2 Γ ( 2 r − 2 k )
■
[b] 結合密度関数から直接導く。
■
[c] 確率密度関数にスターリング近似を使用する。
■
[d] カイ二乗分布の比によって迂回する。
■
コード 以下はコーシー分布、t分布 、コーシー分布の確率密度関数を表示するJulia のコードだ。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__ )
x = -4 :0.1 :4
plot(x, pdf.(Cauchy(), x),
color = :red,
label = "Cauchy" , size = (400 ,300 ))
plot!(x, pdf.(TDist(3 ), x),
color = :orange,
label = "t(3)" , size = (400 ,300 ))
plot!(x, pdf.(TDist(30 ), x),
color = :black, linestyle = :dash,
label = "t(30)" , size = (400 ,300 ))
plot!(x, pdf.(Normal(), x),
color = :black,
label = "Standard Normal" , size = (400 ,300 ))
xlims!(-4 ,5 ); ylims!(0 ,0.5 ); title!(L"\mathrm{pdf\,of\, t}(\nu)" )
png("pdf" )