기계학습에서 선형회귀모델의 최대우도 추정
📂머신러닝기계학습에서 선형회귀모델의 최대우도 추정
정리
데이터 xi∈Rn와 이의 레이블 yi∈R 사이의 관계가 다음과 같은 선형모델이라 가정하자.
yi=wTxi+ϵi,i=1,…,K(1)
K>n이라 할 때, 우도가 최대인 파라미터 wML는 다음과 같다.
wML=(XTX)−1XTy
이때 y=[y1⋯yK]T이고, X=[x1⋯xK]T∈RK×n이다.
설명
(1)에서 w∈Rn은 모수파라미터이며, ϵi∼N(0,σ2)은 [가우시안 노이즈]이다. ϵi가 N(0,σ2)을 따른다고 가정했으므로, yi=wTxi+ϵi는 N(wTxi,σ2)을 따른다.
yi∼N(wTxi,σ2)
최대우도 추정은 다음을 만족하는 wML를 찾는 것이다.
wML=wargmaxp(y∣w,X)
yi와 y에 대한 w의 우도 함수는 다음과 같다.
p(yi∣w,xi)=2πσ21exp[−2σ2(yi−wTxi)2]
p(y∣w,X)=i=1∏Kp(yi∣w,xi)=i=1∏K2πσ21exp[−2σ2(yi−wTxi)2]=(2πσ2)K/21exp[−2σ21i=1∑K(yi−wTxi)2]=(2πσ2)K/21exp[−2σ21∥y−Xw∥22]
우도가 지수함수로 표현되므로, 이 때는 로그 우도를 고려하는게 계산에 있어서 편리하다.
wML=wargmaxlogp(y∣w,X)=wargmax(2πσ2)K/21(−2σ21∥y−Xw∥22)=wargmax(−∥y−Xw∥22)=wargmin∥y−Xw∥22
최소제곱법에 따라, wML는 다음과 같다.
wML=(XTX)−1XTy
같이보기