t-分布

定義 ¹

自由度$\nu > 0$に対して、次の確率密度関数を持つ連続確率分布$t \left( \nu \right)$をt-分布という。 $$ f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R} $$

$\Gamma (\nu)$はガンマ関数だ。

説明

t-分布は、今でもビールで有名なギネス醸造所で働いていたウィリアム・ゴセット^{william S. Gosset}によって発見され、公表された分布である。その当時、企業に所属していたため、彼は学生という筆名で投稿し、それが学生t-分布とも呼ばれるようになった。統計学の新入生は、当初、標本が正規分布に従うと仮定されるが、実際には30個に達しない小さなサンプルで使用される分布に最初に遭遇する。$\nu \ge 30$のときは、ほぼ正規分布に収束したとみなされる。

一方、特に$\nu = 1$のときの分布はコーシー分布と呼ばれる。

基本的な性質

モーメント生成関数

平均と分散

[2]: $X \sim t (\nu)$であれば $$ \begin{align*} E(X) =& 0 & \qquad , \nu >1 \\ \Var(X) =& {{ \nu } \over { \nu - 2 }} & \qquad , \nu > 2 \end{align*} $$

定理

二つの確率変数$W,V$が独立であり、$W \sim N(0,1)$、$V \sim \chi^{2} (r)$であるとする。

$k$次モーメント

[a]: $k < r$であれば$\displaystyle T := { {W} \over {\sqrt{V/r} } }$は$k$次のモーメントが存在し $$ E T^{k} = E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }} $$

標準正規分布とカイ二乗分布から導かれる

[b]: $${ {W} \over {\sqrt{V/r} } } \sim t(r)$$

スチューデントt分布の極限分布として標準正規分布を導く

[c]: $T_n \sim t(n)$であれば $$ T_n \ \overset{D}{\to} N(0,1) $$

F分布を導く

[d]: 自由度$\nu > 0$のt-分布に従う確率変数$X \sim t(\nu)$について、次のように定義された$Y$はF分布$F (1,\nu)$に従う。 $$ Y := X^{2} \sim F (1,\nu) $$

$N \left( \mu , \sigma^{2} \right)$は平均が$\mu$で分散が$\sigma^{2}$の正規分布だ。
$\chi^{2} \left( r \right)$は自由度$r$のカイ二乗分布だ。

証明

1

確率変数のモーメント生成関数が存在するとは、すべての$k \in \mathbb{N}$に対して$k$次のモーメントが存在することを意味する。しかし、定理[a]によれば、t分布の$k$次モーメントは$k < r$のときに存在するため、モーメント生成関数は存在しない。

■

[2]

モーメント公式[a]を使用する。

■

[a]

カイ二乗分布のモーメント: $X \sim \chi^{2} (r)$とする。$k > - r/ 2$であれば$k$次モーメントが存在し $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$

$k < r$の両辺に$-1/2$を掛けると$-k/2 > -r/2$となるので $$ \begin{align*} E T^{k} =& E \left[ W^{k} \left( {{ V } \over { r }} \right)^{-k/2} \right] \\ =& E W^{k} E \left( {{ V } \over { r }} \right)^{-k/2} \\ =& E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }} \end{align*} $$

■

[b]

結合密度関数から直接導く。

■

[c]

確率密度関数にスターリング近似を使用する。

■

[d]

カイ二乗分布の比によって迂回する。

■

コード

以下はコーシー分布、t分布、コーシー分布の確率密度関数を表示するJuliaのコードだ。

@time using LaTeXStrings
@time using Distributions
@time using Plots

cd(@__DIR__)

x = -4:0.1:4
plot(x, pdf.(Cauchy(), x),
 color = :red,
 label = "Cauchy", size = (400,300))
plot!(x, pdf.(TDist(3), x),
 color = :orange,
 label = "t(3)", size = (400,300))
plot!(x, pdf.(TDist(30), x),
 color = :black, linestyle = :dash,
 label = "t(30)", size = (400,300))
plot!(x, pdf.(Normal(), x),
 color = :black,
 label = "Standard Normal", size = (400,300))

xlims!(-4,5); ylims!(0,0.5); title!(L"\mathrm{pdf\,of\, t}(\nu)")
png("pdf")

Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p191. ↩︎