残差二乗和の勾配
📂多変数ベクトル解析残差二乗和の勾配
概要
統計学および機械学習の多くの回帰問題では、以下のように残差平方和を目的関数として使用し、特にfが線形結合の場合、行列形で簡潔に表現することができる。
RSS====k∑(yk−f(xk))2k∑(yk−(s0+s1xk1+⋯+spxkp))2(y−Xs)T(y−Xs)∥y−Xs∥22
これをさらに一般化して、行列R∈Rn×nに対して、以下の形を持つスカラー関数のグラディエントを導出する。
公式
f(s):=(y−Xs)TR(y−Xs)
sに依存しないベクトルy∈Rnと行列X∈Rn×p、R∈Rn×nに対して、以下が成り立つ。
∂s∂f(s)=−XT(R+RT)(y−Xs)
導出
転置行列の性質: r,s∈RとA,Bがそれぞれの場合で行列操作が適切に定義されるサイズを持つとする。すると、以下が成立する。
- (a) 線形性: (rA+sB)T=rAT+sBT
ベクトルと行列のグラディエント:
∂w∂wTx=∂w∂xTw=x
∂w∂(wTRw)=(R+RT)w
∂s∂f(s)======∂s∂(y−Xs)TR(y−Xs)∂s∂(yT−sTXT)R(y−Xs)∂s∂(−sTXTRy−yTRXs+sTXTRXs)−XTRy−XTRTy+XT(R+RT)Xs−XT(R+RT)y+XT(R+RT)Xs−XT(R+RT)(y−Xs)
■
系1
系として、Rが対称行列ならば
∂s∂f(s)=−2XTR(y−Xs)
そして、単位行列ならば、次を得る。
∂s∂f(s)=−2XT(y−Xs)
系2
アダマール積⊙について、f(s):=∥X(τ⊙s)−y∥22と定義すると、X(τ⊙s)=Xdiag(τ)sが適用されるので
∂s∂f(s)=2(Xdiag(τ))T(Xdiag(τ)s−y)=2diag(τ)TXT(X(τ⊙s)−y)=2τ⊙XT(X(τ⊙s)−y)