t-分布
定義 1
自由度$\nu > 0$に対して、次の確率密度関数を持つ連続確率分布$t \left( \nu \right)$をt-分布という。 $$ f(x) = {{ \Gamma \left( {{ \nu + 1 } \over { 2 }} \right) } \over { \sqrt{\nu \pi} \Gamma \left( {{ \nu } \over { 2 }} \right) }} \left( 1 + {{ x^{2} } \over { \nu }} \right)^{- {{ \nu + 1 } \over { 2 }}} \qquad ,x \in \mathbb{R} $$
- $\Gamma (\nu)$はガンマ関数だ。
説明
t-分布は、今でもビールで有名なギネス醸造所で働いていたウィリアム・ゴセットwilliam S. Gossetによって発見され、公表された分布である。その当時、企業に所属していたため、彼は学生という筆名で投稿し、それが学生t-分布とも呼ばれるようになった。統計学の新入生は、当初、標本が正規分布に従うと仮定されるが、実際には30個に達しない小さなサンプルで使用される分布に最初に遭遇する。$\nu \ge 30$のときは、ほぼ正規分布に収束したとみなされる。
一方、特に$\nu = 1$のときの分布はコーシー分布と呼ばれる。
基本的な性質
モーメント生成関数
平均と分散
- [2]: $X \sim t (\nu)$であれば $$ \begin{align*} E(X) =& 0 & \qquad , \nu >1 \\ \operatorname{Var}(X) =& {{ \nu } \over { \nu - 2 }} & \qquad , \nu > 2 \end{align*} $$
定理
二つの確率変数$W,V$が独立であり、$W \sim N(0,1)$、$V \sim \chi^{2} (r)$であるとする。
$k$次モーメント
- [a]: $k < r$であれば$\displaystyle T := { {W} \over {\sqrt{V/r} } }$は$k$次のモーメントが存在し $$ E T^{k} = E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }} $$
標準正規分布とカイ二乗分布から導かれる
- [b]: $${ {W} \over {\sqrt{V/r} } } \sim t(r)$$
スチューデントt分布の極限分布として標準正規分布を導く
- [c]: $T_n \sim t(n)$であれば $$ T_n \ \overset{D}{\to} N(0,1) $$
F分布を導く
- [d]: 自由度$\nu > 0$のt-分布に従う確率変数$X \sim t(\nu)$について、次のように定義された$Y$はF分布$F (1,\nu)$に従う。 $$ Y := X^{2} \sim F (1,\nu) $$
- $N \left( \mu , \sigma^{2} \right)$は平均が$\mu$で分散が$\sigma^{2}$の正規分布だ。
- $\chi^{2} \left( r \right)$は自由度$r$のカイ二乗分布だ。
証明
1
確率変数のモーメント生成関数が存在するとは、すべての$k \in \mathbb{N}$に対して$k$次のモーメントが存在することを意味する。しかし、定理[a]によれば、t分布の$k$次モーメントは$k < r$のときに存在するため、モーメント生成関数は存在しない。
■
[2]
■
[a]
カイ二乗分布のモーメント: $X \sim \chi^{2} (r)$とする。$k > - r/ 2$であれば$k$次モーメントが存在し $$ E X^{k} = {{ 2^{k} \Gamma (r/2 + k) } \over { \Gamma (r/2) }} $$
$k < r$の両辺に$-1/2$を掛けると$-k/2 > -r/2$となるので $$ \begin{align*} E T^{k} =& E \left[ W^{k} \left( {{ V } \over { r }} \right)^{-k/2} \right] \\ =& E W^{k} E \left( {{ V } \over { r }} \right)^{-k/2} \\ =& E W^{k} {{ 2^{-k/2} \Gamma \left( {{ r } \over { 2 }} - {{ k } \over { 2 }} \right) } \over { \Gamma \left( {{ r } \over { 2 }} \right) r^{-k/2} }} \end{align*} $$
■
[b]
■
[c]
■
[d]
■
コード
以下はコーシー分布、t分布、コーシー分布の確率密度関数を表示するJuliaのコードだ。
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = -4:0.1:4
plot(x, pdf.(Cauchy(), x),
color = :red,
label = "Cauchy", size = (400,300))
plot!(x, pdf.(TDist(3), x),
color = :orange,
label = "t(3)", size = (400,300))
plot!(x, pdf.(TDist(30), x),
color = :black, linestyle = :dash,
label = "t(30)", size = (400,300))
plot!(x, pdf.(Normal(), x),
color = :black,
label = "Standard Normal", size = (400,300))
xlims!(-4,5); ylims!(0,0.5); title!(L"\mathrm{pdf\,of\, t}(\nu)")
png("pdf")
Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p191. ↩︎