logo

t-分布 📂確率分布論

t-分布

定義 1

pdf.png

自由度ν>0\nu > 0に対して、次の確率密度関数を持つ連続確率分布t(ν)t \left( \nu \right)をt-分布という。 f(x)=Γ(ν+12)νπΓ(ν2)(1+x2ν)ν+12,xR f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R}


説明

t-分布は、今でもビールで有名なギネス醸造所で働いていたウィリアム・ゴセットwilliam S. Gossetによって発見され、公表された分布である。その当時、企業に所属していたため、彼は学生という筆名で投稿し、それが学生t-分布とも呼ばれるようになった。統計学の新入生は、当初、標本が正規分布に従うと仮定されるが、実際には30個に達しない小さなサンプルで使用される分布に最初に遭遇する。ν30\nu \ge 30のときは、ほぼ正規分布に収束したとみなされる。

一方、特にν=1\nu = 1のときの分布はコーシー分布と呼ばれる。

基本的な性質

モーメント生成関数

平均と分散

  • [2]: Xt(ν)X \sim t (\nu)であれば E(X)=0,ν>1Var(X)=νν2,ν>2 \begin{align*} E(X) =& 0 & \qquad , \nu >1 \\ \operatorname{Var}(X) =& {{ \nu } \over { \nu - 2 }} & \qquad , \nu > 2 \end{align*}

定理

二つの確率変数W,VW,Vが独立であり、WN(0,1)W \sim N(0,1)Vχ2(r)V \sim \chi^{2} (r)であるとする。

kkモーメント

  • [a]: k<rk < rであればT:=WV/r\displaystyle T := { {W} \over {\sqrt{V/r} } }kk次のモーメントが存在し ETk=EWk2k/2Γ(r2k2)Γ(r2)rk/2 E T^{k} = E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }}

標準正規分布とカイ二乗分布から導かれる

  • [b]: WV/rt(r){ {W} \over {\sqrt{V/r} } } \sim t(r)

スチューデントt分布の極限分布として標準正規分布を導く

  • [c]: Tnt(n)T_n \sim t(n)であれば Tn DN(0,1) T_n \ \overset{D}{\to} N(0,1)

F分布を導く

  • [d]: 自由度ν>0\nu > 0t-分布に従う確率変数Xt(ν)X \sim t(\nu)について、次のように定義されたYYF分布F(1,ν)F (1,\nu)に従う。 Y:=X2F(1,ν) Y := X^{2} \sim F (1,\nu)

  • N(μ,σ2)N \left( \mu , \sigma^{2} \right)は平均がμ\muで分散がσ2\sigma^{2}正規分布だ。
  • χ2(r)\chi^{2} \left( r \right)は自由度rrカイ二乗分布だ。

証明

1

確率変数のモーメント生成関数が存在するとは、すべてのkNk \in \mathbb{N}に対してkk次のモーメントが存在することを意味する。しかし、定理[a]によれば、t分布のkk次モーメントはk<rk < rのときに存在するため、モーメント生成関数は存在しない。

[2]

モーメント公式[a]を使用する。

[a]

カイ二乗分布のモーメント: Xχ2(r)X \sim \chi^{2} (r)とする。k>r/2k > - r/ 2であればkk次モーメントが存在し EXk=2kΓ(r/2+k)Γ(r/2) E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }}

k<rk < rの両辺に1/2-1/2を掛けるとk/2>r/2-k/2 > -r/2となるので ETk=E[Wk(Vr)k/2]=EWkE(Vr)k/2=EWk2k/2Γ(r2k2)Γ(r2)rk/2 \begin{align*} E T^{k} =& E \left[ W^{k} \left( {{ V } \over { r }} \right)^{-k/2} \right] \\ =& E W^{k} E \left( {{ V } \over { r }} \right)^{-k/2} \\ =& E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }} \end{align*}

[b]

結合密度関数から直接導く。

[c]

確率密度関数にスターリング近似を使用する。

[d]

カイ二乗分布の比によって迂回する。

コード

以下はコーシー分布、t分布、コーシー分布の確率密度関数を表示するJuliaのコードだ。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = -4:0.1:4
plot(x, pdf.(Cauchy(), x),
 color = :red,
 label = "Cauchy", size = (400,300))
plot!(x, pdf.(TDist(3), x),
 color = :orange,
 label = "t(3)", size = (400,300))
plot!(x, pdf.(TDist(30), x),
 color = :black, linestyle = :dash,
 label = "t(30)", size = (400,300))
plot!(x, pdf.(Normal(), x),
 color = :black,
 label = "Standard Normal", size = (400,300))

xlims!(-4,5); ylims!(0,0.5); title!(L"\mathrm{pdf\,of\, t}(\nu)")
png("pdf")

  1. Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p191. ↩︎