행렬 미분소
📂다변수벡터해석행렬 미분소
정의
n×n 행렬 X=[xij]a의 미분소 dX는 다음과 같이 정의된다.
dX=dx11dx21⋮dxn1dx12dx22⋮dxn2⋯⋯⋱⋯dx1ndx2n⋮dxnn
설명
일변수 함수의 미분소 dx를 벡터로 일반화 한 것이 dx라면, 이를 행렬로 일반화한 것이 dX이다.
일변수함수 f:R→R의 전미분:
df=dxdfdx
다변수함수 f:Rn→R의 전미분:
df=i∑∂xi∂fdxi=⟨∇xf,dx⟩=(∇xf)Tdx=[∂x1∂f⋯∂xn∂f]dx1⋮dxn
행렬변수함수function of a matrix f:Rn×n→R의 전미분:
df=i,j∑∂xij∂fdxij=⟨∇Xf,dX⟩=Tr((∇Xf)TdX)
스칼라의 미분소 dx에 대한 성질이 그대로 유지된다.
d(ax)=adxd(x+y)=dx+dyd(xy)=ydx+xdy
성질
변수인 행렬 X,Y∈Rn×n와 스칼라 α∈R, 상수 행렬 A∈Rn×n에 대해서 다음이 성립한다.
- d(αX)=αdX
- d(XT)=(dX)T
- d(AX)=AdX 그리고 d(XA)=(dX)A
- d(X+Y)=dX+dY
- d(XY)=(dX)Y+XdY
증명
3.
[AX]ij=∑k=1naikxkj이므로,
[d(AX)]ij=d(k=1∑naikxkj)=k=1∑naik(dxkj)
⟹d(AX)=AdX
■
5.
[XY]ij=∑k=1nxikykj이므로,
[d(XY)]ij=d(k=1∑nxikykj)=k=1∑n(dxik)ykj+k=1∑nxikdykj
따라서 다음을 얻는다.
[d(XY)]ij=k=1∑nxikdykj+k=1∑nxikdykj=[(dX)Y]ij+[XdY]ij⟹d(XY)=(dX)Y+XdY
■