回帰係数の定義と推定量の公式導出
📂統計的分析回帰係数の定義と推定量の公式導出
定義
Y=β0+β1X1+⋯+βpXp+ε
多重回帰分析で与えられた p 個の独立変数 X1,⋯,Xp に対して、上記のような線形モデルlinear modelを立てるとき、β0,β1,⋯,βp を 回帰係数regression Coefficientとする。Y は従属変数、ε はランダムに分布されたエラーを意味する。
公式
y1y2⋮yn=11⋮1x11x12⋮x1n⋯⋯⋱⋯xp1xp2⋮xpnβ0β1⋮βp+ε1ε2⋮εn
n 個のデータが与えられていて p<n とすると、線形多重回帰モデルを計画行列で表すと上記のようになり、簡単にY=Xβ+ε と表す。β に対して最小二乗の推定量ベクトル β^ は次のようになる。
β^=β^0β^1⋮β^p=(XTX)−1XTY
それだけでなく、β^ は β の最良不偏推定量であるため、最良線形不偏推定量Best Linear Unbiased Estimator, BLUEとも呼ばれる。
導出
我々の目標は
∥ε∥22=k=0∑nεk=[ε0ε1⋯εn]ε0ε1⋮εn=εTε
を最小化することだ。ε=Y−Xβ なので εTε=(Y−Xβ)T(Y−Xβ) を最小化する β を探せば良い。
残差平方和の勾配:
f(s):=(y−Xs)TR(y−Xs)
としよう。R が単位行列なら次を得る。
∂s∂f(s)=−2XT(y−Xs)
両辺を β で偏微分した
∂β∂εTε===−2XT(Y−Xβ)−2XT(Y−Xβ)−2XTY+2XTXβ
が零ベクトル 0 になるような β^ は次の形をとる。
β^=βargminεTε=(XTX)−1XTY
一方で β^ は β に対する不偏推定量であることを簡単に示すことができ、最小二乗法を通して導出されたため、これより分散が小さい β の不偏推定量は存在せず、最良不偏推定量である。
■
もし導出過程で β に微分する部分があまり気に入らないなら、行列代数でアプローチする代案もある。行列代数での最小二乗法で
X∗Y=X∗Xβ^
を満たす β^ が最小二乗解となる点で、X∈Rn×p なので X∗=XT であり、結論的に β^=(XTX)−1XTY を得る。
帰結
β^ が最良線形不偏推定量なら、yk の和と適合値 y^k=1=β^0+∑j=1pβ^jxj の和は等しい:
k=1∑nyk=k=1∑ny^k
証明
本公式の証明で β^ が最良線形不偏推定量というのは、
⟹⟹0=−2XTY+2XTXβ^0=XT(Y−Xβ^)0=XTy1−y^1⋮yn−y^n
が成立することを意味する。X が計画行列であるため、XT の最初の行はすべての成分が 1 である1行列であると考えられる。XT の最初の行と Y−Xβ^ の積を見れば次のようになる。
⟹⟹0=[1⋯1]y1−y^1⋮yn−y^n0=(y1−y^1)+⋯+(yn−y^n)0=k=1∑nyk−k=1∑ny^k
結果的に、次を得る。
k=1∑nyk=k=1∑ny^k
■
参照