多重回帰分析における残差の分散の推定量と回帰係数の標準誤差
📂統計的分析多重回帰分析における残差の分散の推定量と回帰係数の標準誤差
定理
y1y2⋮yn=11⋮1x11x12⋮x1n⋯⋯⋱⋯xp1xp2⋮xpnβ0β1⋮βp+ε1ε2⋮εn
p 個の独立変数とn 個のデータが与えられた時、線形重回帰モデルを計画行列で表すと上のようになり、簡単にY=Xβ+ε と表そう。回帰係数の推定値はβ^=(XTX)−1XTY であるから、適合値のベクトルY^ は
Y^=Xβ^=X(XTX)−1XTY
とわかっている。便宜上P:=X(XTX)−1XT としよう。一方、残差は線形性を持つこと、つまりε1,⋯,εn の母平均は0 と仮定する。
残差平方和の期待値
- [1]: もし残差が等分散性も持っているなら、つまりある定数σ>0 に対してε1,⋯,εn∼(0,σ2) が成立するなら、SSEsum of squared errorの期待値は次のようになる。
E(SSE)=E[i=1∑n(yi−y^i)2]=nσ2−i,j∑E(yiyj)Pij
残差平方和の分散に対する不偏推定量
- [2]: もし残差が独立性も持っているなら、つまりε1,⋯,εn∼iid(0,σ2) が成立するなら、SSE の分散に対する不偏推定量σ2は次のようになる。
Eσ2=E[n−p−11i=1∑n(yi−y^i)2]=σ2
回帰係数の標準誤差
- [3] もし残差が正規性も持っているなら、つまりε1,⋯,εn∼iidN(0,σ2)が成立するなら、回帰係数の標準誤差は次のようになる。
s.e.(β^k)=σ^[(XTX)−1]kk
説明
ほとんどの統計学部の学生は、学校で回帰分析を初めて学ぶ時には、プロジェクトや他の科目に追われて、こうした数理統計学的な理論展開を大雑把に見過ごす場合が多い。意欲やモチベーションとは無関係に、内容が理解するには難しすぎるので、無理に勉強するのも効率が良くないと思う。証明が最初から理解できないと感じたら、失望せずに立ち去っても大丈夫。
しかし、修士以上で学業を続け、学部科目を復習するなら、ここに上手く整理された内容を見ることを強くお勧めする。重回帰分析のモデル診断で最も重要なのは線形性であり、次に等分散性、その次は独立性、その後が正規性であるが、回帰分析でのt-検定、F-検定を導くためには、正確にその順序で仮定が追加されなければならない。直感や経験からその序列を理解できないかもしれないが、理論学習だけで納得できるというのは、幸いである。
証明
戦略: そう簡単ではないかもしれない。数理統計学はともかくとして、最低でも行列代数について十分に学んでいなければならない。定理のステートメントで簡単にP:=X(XTX)−1XT と示したP が冪等idempotent、つまり射影作用素であること、つまり
P2=====X(XTX)−1XT⋅X(XTX)−1XTX(XTX)−1(XTX)(XTX)−1XTX(XTX)−1XTPPT
したがってP2=P=PT であり、その直交射影作用素 (I−P) も射影作用素であるため、(I−P)2=(I−P) が成り立つという事実を補助定理として使う。ここから難しいと感じるなら、無理に今この証明を見ようとせず、数年勉強してから再び戻ることをお勧めする。
[1]
クロネッカーデルタδij={10,if i=j,if i=j について、次のことが成立する:
E[i=1∑n(yi−y^i)2]==========E[(Y−PY)T(Y−PY)]E[[(I1+p−P)Y]T[(I1+p−P)Y]]E[YT(I1+p−P)T(I1+p−P)Y]E[YT(I1+p−P)(I1+p−P)Y]E[YT(I1+p−P)2Y]E[YT(I1+p−P)Y]E[i,j∑yiyj(δij−Pij)]i,j∑E[yiyjδij]−i,j∑E[yiyjPij]i∑E[yi2]−i,j∑E[yiyj]Pijnσ2−i,j∑E[yiyj]Pij
■
[2]
残差が独立ということは、i=jの場合、yi とyj も相関関係がないということで、i=j の時E[yiyj]=0 であり、i=j の時、残差の線形性と等分散性によりE[yiyj]=σ2 だから、次を得る:
E[i=1∑n(yi−y^i)2]==nσ2−i,j∑E[yiyj]Pijnσ2−i∑σ2Pii
トレースの巡回性:
Tr(ABC)=Tr(BCA)=Tr(CAB)
∑iPii はPのトレースtrP だから、
E[i=1∑n(yi−y^i)2]======nσ2−σ2i∑Piiσ2(n−trP)σ2(n−trX(XTX)−1XT)σ2(n−trXTX(XTX)−1)σ2(n−trI1+p)σ2(n−(1+p))
を得る。両辺を(n−p−1) で割ると、
n−p−11E[i=1∑n(yi−y^i)2]=σ2
だから、σ2 の不偏推定量σ2=∑(yi−y^i)2/(n−p−1)を得る。
■
[3]
回帰係数ベクトルの多変量正規性:
β^∼N1+p(β,σ2(XTX)−1)
残差がiidで正規分布に従う場合、β^=(β^0,⋯,β^p)のk番目の成分β^kのマージナル確率分布も以下のような単変量正規分布に従う:
β^k∼N(βk,σ2[(XTX)−1]kk)
標準誤差の一般的な定義:ある推定量estimator Tに対し、T の標準偏差の推定値estimateを標準誤差standard errorという。
s.e.(T):=Var(T)
Varβ^k=σ2[(XTX)−1]kk だから、次を得る。
s.e.(β^k)====Var(β^k)σ2[(XTX)−1]kkn−p−11i=1∑n(yi−y^i)2[(XTX)−1]kkσ^[(XTX)−1]kk
■