スチューデントのt検定の証明
📂数理統計学スチューデントのt検定の証明
定理
確率変数 X1,⋯,Xn がiidで正規分布 N(μ,σ2) に従うとすると
- (a):
X∼N(μ,nσ2)
- (b):
X⊥S2
- (c):
(n−1)σ2S2∼χ2(n−1)
- (d):
T=S/nX−μ∼t(n−1)
- 標本平均 X と 標本分散 S2 は、次のように定義される確率変数だ。
X:=n1k=1∑nXkS2:=n−11k=1∑n(Xk−X)2
説明
統計学をする人たちは当たり前のように使っているけど、事実これにも名前がある。四つのパートに分けられていて、具体的に引用するのも難しい。
(b)は、標本平均でも標本分散でも、同じデータから出ているにもかかわらず、独立であるというのがそう。
小標本に対する母平均の推定
スチューデントの定理の証明は小標本での母平均に対する仮説検定の導出そのものだ。
証明
(a)
X=n(X1+X2+⋯+Xn) なので、正規分布に従う確率変数の和を考えた場合
X∼N(μ,n1σ2)
■
(b)
- 0 はゼロベクトルを示す。
- 1=(1,⋯,1)=1⋮1 はすべての成分が1 であるベクトルを示す。
- I は単位行列を示す。
- AT は行列Aの転置行列を示す。
v:=n11 とする。
ランダムベクトル X:=(X1,⋯,Xn) は多変量正規分布に従い
X===n1(X1+⋯+Xn)=n1[1⋯1]X1⋮Xnn11TXvTX
今、ランダムベクトル Y:=(X1−X,⋯,Xn−X) を定義すれば、あるランダムベクトル W は次のように表せる。
W=[XY]=[vTI−1vT]X
W は多変量正規分布に従うランダムベクトルが線形変換されたものなので、やはり多変量正規分布に従い、その母平均ベクトルは上の式に期待値を取った
EW=[vTI−1vT]μ1=[μ0n]
であり、共分散行列 Σ は
Σ==[vTI−1vT]σ2I[vTI−1vT]Tσ2[1/n0n0nTI−1vT]
である。ここで、X はY と独立であることがわかり
S2=n−11k=1∑n(Xk−X)2=n−11YTY
したがって、X⊥S2 である。
■
(c)
V=i=1∑n(σXi−μ)2とした場合 σXi−μ∼N(0,1)なのでV∼χ2(n)であるとし
V===i=1∑n(σXi−μ)2i=1∑n(σ(Xi−X)+(X−μ))2i=1∑n(σXi−X)2+(σ/nX−μ)2
ここで
i=1∑n(σXi−X)2=σ2n−1i=1∑nn−1(Xi−X)2=(n−1)σ2S2
整理すると
V=(n−1)σ2S2+(σ/nX−μ)2
V∼χ2(n) であり、スチューデントの定理の(a)により
(σ/nX−μ)∼N(0,1)
であり、標準正規分布の二乗はカイ二乗分布に従うので
(σ/nX−μ)2∼χ2(1)
スチューデントの定理の(b)で、X と S2 が独立であることが示されたので、両辺をモーメント生成関数として
(1−2t)−n/2=E{exp((n−1)σ2S2t)}(1−2t)−1/2
したがって、(n−1)σ2S2のモーメント生成関数は(1−2t)−(n−1)/2である。
■
(d)
正規分布とカイ二乗分布からスチューデントのt分布の導出: W∼N(0,1)が真であり、V∼χ2(r)ならば
T=V/rW∼t(r)
T=S/nX−μ=(n−1)S2/(σ2(n−1))(X−μ)/(σ/n)
スチューデントの定理の(a)でX∼N(μ,nσ2)が、(c)で(n−1)σ2S2∼χ2(n−1)であることが示されたので、
T∼t(n−1)
■