공간데이터분석에서 랜덤필드Y=(Y(s1),⋯,Y(sn)) 의 평균μ∈R 과 공분산행렬Σ∈Rn×n 과 다변량정규분포를 따르는 ε∼Nn(0,Σ) 에 대해, 다음의 모델
Y=μ1+ε
을 통해 새로운 사이트sites0 의 Y(s0) 를 추정한 값을 오디너리 크리깅 추정치ordinary Kriging Estimate라 한다. 이렇게 모델을 세워서 추정하는 행위 자체를 크리깅이라 부르기도 한다.
유니버설 크리깅
X:=11⋮1X1(s1)X1(s2)⋮X1(sn)⋯⋯⋱⋯Xp(s1)Xp(s2)⋮Xp(sn)
독립변수 X1,⋯,Xp 에 대해 위와 같은 디자인 매트릭스와 회귀계수의 벡터를 β=(β0,β1,⋯,βp) 라 할 때, 다변량정규분포를 따르는 ε∼Nn(0,Σ) 에 대해 다음의 모델
Y=Xβ+ε
을 통해 새로운 사이트sites0 에서의 x(s0)=(x1(s0),⋯,xp(s0)) 를 사용해 Y(s0) 를 추정하는 과정을 유니버설 크리깅universal Kriging이라 한다.
유니버설 크리깅이란 쉽게 말해 크리깅에 다중회귀분석이 가미된 크리깅을 말하며, 오디너리 크리깅에서의 μ 는 유니버설 크리깅에서의 β0 와 같은 역할을 한다. 시계열분석으로 치자면 동적 회귀 모델이라고 보면 되는데, 우리가 관심있는 변수인 Y 를 설명하기 위한 정보로써 순수하게 공간적인 구조 말고도 다른 변수들이 있을때 고려하게 된다.
수식을 보면 사실 회귀분석 파트가 좀 있어서 달라보일 뿐이지 Xβ 을 좌변으로 넘겨서
(Y−Xβ)=0+ε
이라 두면 그냥 평균벡터가 영벡터 μ=0 인 오디너리 크리깅 그 자체다.
공식
랜덤필드{Y(sk)}k=1n 가 내재적 정상 공간과정이라고 하고 새롭계 예측하고 싶은 지점을 s0 이라 하자. 배리오그램2γ 에 대해 벡터γ∈Rn 을 (γ)i:=(γ(s0−si)) 와 같이 정의하자. 어떤 벡터 λ=(λ1,⋯,λn) 에 대해 Y(s0) 의 최선선형불편예측량bLUP, Best Linear Unbiased Predictor은 λ 과 Y 의 내적인
λTY=[λ1⋯λn]Y(s1)Y(s2)⋮Y(sn)=k=1∑nλkY(sk)
이며, 벡터 λ 는 구체적으로 다음과 같이 구해진다.
λ=Σ−1γ+Σ−1X(XTΣ−1X)−1(x0−XTΣ−1γ)
E[(Y(s0)−h(y))2y]
우리의 목표는 데이터 y=(y(s1),⋯,y(sn)) 가 주어져 있을 때 위와 같은 에러를 최소화하는 h(y) 를 구하는 것이다.
=≥E[(Y(s0)−h(y))2y]E[(Y(s0)−E(Y(s0)∣y))2y]+[E(Y(s0)∣y)−h(y)]2E[(Y(s0)−E(Y(s0)∣y))2y]
이 식에서 등식이 성립하는 필요충분조건은 h(y)=E(Y(s0)∣y) 이다.
Part 2. 조건부 다변량정규분포
기본적으로 주어진 데이터는 다변량정규분포Nn(0,Σ) 를 따른다는 전제 하에, 여기에 새로운 Y0:=Y(S0)∼N(μ0,σ02) 를 추가해도 여전히 (1+n)변량 변량정규분포를 따른다는 가정에서 시작한다. 이를 블럭행렬꼴로 나타내보면 다음과 같다.
Y0Y1⋮Yn=[Y0Y]∼N1+n([μ0μ],[σ02γγTΣ])
다변량정규분포의 조건부 평균과 분산:
X=μ=Σ=[X1X2][μ1μ2][Σ11Σ21Σ12Σ22]:Ω→Rn∈Rn∈Rn×n
위와 같이 조던블럭폼으로 나타낸 X, μ, Σ 에 대해 다변량정규분포를 따르는 랜덤벡터X∼Nn(μ,Σ) 가 주어져 있다고 하자. 그러면 조건부확률벡터X1∣X2:Ω→Rm 는 여전히 다변량정규분포를 따르며, 구체적으로 다음과 같이 모평균 벡터와 모공분산행렬을 가진다.
X1∣X2∼Nm(μ1+Σ12Σ22−1(X2−μ2),Σ11−Σ12Σ22−1Σ21)
따라서 데이터 Y 가 주어졌을 때 Y0 의 기대값은 s0 에서의 x0=x(s0)∈Rp 에 대해
==E(Y(s0)∣Y)μ0+γTΣ−1(Y−Xβ)x0Tβ+γTΣ−1(Y−Xβ)
이다. 한편 회귀계수의 벡터β 는 다변량정규분포를 따르는 ε 의 각 성분이 독립이 아니라서 그냥 OLSordinary Least Square의 β^=(XTX)−1XTY 를 쓸 수 없고 WLSweighted Least Square의 β^=(XTΣ−1X)−1XTΣ−1Y 가 쓰여야한다.
===E(Y(s0)∣Y)x0Tβ+γTΣ−1Y−γTΣ−1Xβx0Tβ+γTΣ−1Y−γTΣ−1XβγTΣ−1Y+x0T(XTΣ−1X)−1XTΣ−1Y−γTΣ−1X(XTΣ−1X)−1XTΣ−1Y
여기서 Σ 는 대칭행렬이므로 (Σ−1)T=Σ−1 이고, Y 로 묶어내면 다음과 같이 λTY 꼴을 얻는다.
==γTΣ−1Y+x0T(XTΣ−1X)−1XTΣ−1Y−γTΣ−1X(XTΣ−1X)−1XTΣ−1Y[Σ−1γ+Σ−1X(XTΣ−1X)−1(x0−XTΣ−1γ)]TYλTY
■
실제 분석에서 σ02 과 Σ 의 추정치들은 세미배리오그램의 모형을 통해 다음과 같이 정해진다.
σ02=Σ=σ2+τ2σ2H(ϕ)+τ2I
여기서 τ2 는 너겟 이펙트 분산(이론과 달리 실제 데이터에서 거리에 상관없이 기본적으로 보게 되는 공분산성)고, I 는 항등행렬이다.
Banerjee. (2015). Hierarchical Modeling and Analysis for Spatial Data(2nd Edition): p41~42. ↩︎