独立な正規分布およびカイ二乗分布からのスチューデントのt分布の導出
定理
二つの確率変数 $W,V$ が独立で、$W \sim N(0,1)$、$V \sim \chi^{2} (r)$ である場合、 $$ T = { {W} \over {\sqrt{V/r} } } \sim t(r) $$
- $N \left( \mu , \sigma^{2} \right)$ は平均が $\mu$ で、分散が $\sigma^{2}$ の正規分布だ。
- $\chi^{2} \left( r \right)$ は自由度 $r$ のカイ二乗分布だ。
- $t(r)$ は自由度 $r$ のt-分布だ。
説明
この定理を統計学だけで接近するなら、実用性や歴史的に見てむしろt-分布の定義に近い。
導出1
戦略:ジョイント確率密度関数で直接演繹する。
正規分布の定義:$\mu \in \mathbb{R}$ と $\sigma > 0$ に対して、以下の確率密度関数を持つ連続確率分布 $N \left( \mu,\sigma^{2} \right)$ を正規分布という。 $$ f(x) = {{ 1 } \over { \sqrt{2 \pi} \sigma }} \exp \left[ - {{ 1 } \over { 2 }} \left( {{ x - \mu } \over { \sigma }} \right)^{2} \right] \qquad, x \in \mathbb{R} $$
カイ二乗分布の定義:自由度 $r > 0$ に対して、以下の確率密度関数を持つ連続確率分布 $\chi^{2} (r)$ をカイ二乗分布という。 $$ f(x) = {{ 1 } \over { \Gamma (r/2) 2^{r/2} }} x^{r/2-1} e^{-x/2} \qquad , x \in (0, \infty) $$
$W,V$ の確率密度関数 $f_{1} , f_{2}$ が以下のように与えられるため、 $$ f_1 (w) := { {1} \over {\sqrt{2 \pi }} } e ^{- w^{2} / 2} \\ \displaystyle f_2 (v) ={ 1 \over { \Gamma ({r \over 2}) 2^{r \over 2} } } v^{ {r \over 2} - 1 } e^{-{{v} \over 2}} $$ $W$ と $V$ の[ジョイント]確率密度関数(../1449) $h$ は $w \in \mathbb{R}$、$v \in (0,\infty)$ に対して以下の通りである。 $$ h(w,v) = { {1} \over {\sqrt{2 \pi }} } e ^{- w^{2} / 2} { 1 \over { \Gamma ({r \over 2}) 2^{r \over 2} } } v^{ {r \over 2} - 1 } e^{-{{v} \over 2}} $$ 今、$\displaystyle T := { {W} \over {\sqrt{V/r} } }$ そして $U := V$ とすると、$w = t\sqrt{u} / \sqrt{r}$ そして $v = u$ であるため、 $$ \left| J \right| = \begin{vmatrix} {{\sqrt{u}} \over {\sqrt{r}}} & 0 \\ {{t} \over {2 \sqrt{ur}}} & 1 \end{vmatrix} = \sqrt{{{ u } \over { r }}} $$ 従って、$T, U$ のジョイント確率密度関数は $$ \begin{align*} g(t,u) =& h({ {w} \over {\sqrt{v/r} } },u) |J| \\ =& { {1} \over {\sqrt{2 \pi } \Gamma (r/2) 2^{r/2} } } u^{r/2 -1} \exp \left\{ -{{u} \over {2} } \left( 1 + { {t^2} \over {r} } \right) \right\} { {\sqrt{u} } \over {\sqrt{r} } } \end{align*} $$ $T$ のマージナル確率密度関数は $$ \begin{align*} g(t) =& \int_{-\infty}^{\infty} g(t,u) du \\ =& \int_{0}^{\infty} { {1} \over {\sqrt{2 \pi r} \Gamma (r/2) 2^{r/2} } } u^{(r+1)/2 -1} \exp \left\{ -{{u} \over {2} } \left( 1 + { {t^2} \over {r} } \right) \right\} du \end{align*} $$ $\displaystyle z := {{u} \over {2}} \left( 1 + {{t^2} \over {r}} \right)$ に置換えると、 $$ \begin{align*} g(t) =& \int_{0}^{\infty} { {1} \over {\sqrt{2 \pi r} \Gamma (r/2) 2^{r/2} } } \left( { {2z} \over {1 + t^2 / r} }\right)^{(r+1)/2-1} e^{-z} \left( { {2} \over {1+ t^2 / r} } \right) dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty} {{ 1 } \over { \sqrt{2} 2^{r/2} }}z^{(r+1)/2-1} \left( { {2} \over {1 + t^2 / r} }\right)^{(r+1)/2-1} e^{-z} \left( { {2} \over {1+ t^2 / r} } \right) dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty} {{ 1 } \over { 2^{(r+1)/2} }}z^{(r+1)/2-1} \left( { {2} \over {1 + t^2 / r} }\right)^{(r+1)/2} e^{-z} dz \\ =& { {1} \over {\sqrt{\pi r} \Gamma (r/2) } } \int_{0}^{\infty}z^{(r+1)/2-1} \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} e^{-z} {{ \Gamma \left( (r+1)/2 \right) } \over { \Gamma \left( (r+1)/2 \right) }} dz \\ =& { {\Gamma \left( (r+1)/2 \right)} \over {\sqrt{\pi r} \Gamma (r/2) } } \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} \int_{0}^{\infty} {{ 1 } \over { \Gamma \left( (r+1)/2 \right) }} z^{(r+1)/2-1} e^{-z} dz \\ =& { {\Gamma \left( (r+1)/2 \right)} \over {\sqrt{\pi r} \Gamma (r/2) } } \left( { {1} \over {1 + t^2 / r} }\right)^{(r+1)/2} \cdot 1 \end{align*} $$ 積分関数がガンマ分布 $\Gamma \left( {{ r + 1 } \over { 2 }} , 1 \right) $ の確率密度関数となり、複雑な計算を回避できる。整理すると、 $$ g(t) = {{\Gamma ( (r+1)/2 ) } \over { \sqrt{\pi r} \Gamma (r/2) }} { {1} \over {(1 + t^{2} / r)^{(r+1)/2} } } $$ これは自由度$r$ のt-分布の確率密度関数であるため、 $$ T = { {W} \over {\sqrt{V/r} } } \sim t(r) $$
■
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): 191-192. ↩︎