logo

経験的バリオグラム 📂統計的分析

経験的バリオグラム

ビルドアップ

バリオグラムの定義ユークリッド空間の固定された部分集合 $D \subset \mathbb{R}^{r}$ の中で、方向ベクトル $\mathbf{h} \in \mathbb{R}^{r}$ を持つ確率変数 $Y(s) : \Omega \to \mathbb{R}^{1}$ の集合である空間過程 $\left\{ Y(s) \right\}_{s \in D}$ について考えよう。具体的には、$n \in \mathbb{N}$ 個のサイトを $\left\{ s_{1} , \cdots , s_{n} \right\} \subset D$ として表し、$Y(s)$ がすべての $s \in D$ に対して分散を持つと仮定する。次のように定義される $2 \gamma ( \mathbf{h} )$ をバリオグラムという。 $$ 2 \gamma ( \mathbf{h} ) := E \left[ Y \left( s + \mathbf{h} \right) - Y(s) \right]^{2} $$ 特にバリオグラムの半分 $\gamma ( \mathbf{h} )$ をセミバリオグラムという。

空間データ分析では、バリオグラムは非常に重要だが、現実の世界で全$\mathbf{h}$で計算を行うことは不可能なので、適切な間隔でデータを切って、数値を得るしかない。

定義

ビン $B_{ij}$1

$D \subset \mathbb{R}^{2}$ において、$N$個のデータがある場合、合計$_{N} C_{2} = N(N-1)/2$ペアの距離を取得し、1単位の長さ $h_{x}$ と1単位の幅 $h_{y}$ を計算して、横軸と縦軸に沿ってビンに分けて集合$B_{ij}$を得る。このとき、次を経験的セミバリオグラムという。 $$ \gamma_{ij}^{\ast} = {{ 1 } \over { 2 \left| B_{ij} \right| }} \sum_{ \left\{ (k,l) : \left( s_{k} - s_{l} \right) \in B_{ij} \right\} } \left[ Y \left( s_{k} \right) - Y \left( s_{l} \right) \right]^{2} $$ $D$ の位置 $\left( x_{i}, y_{j} \right)$ ごとに、$\gamma_{ij}^{\ast}$ を対応させたヒートマップまたはサーフェス経験的セミバリオグラム等高線 (ESC) という。

距離 $N(h)$2

距離$h$ に依存する集合 $N \left( h \right) := \left\{ \left( s_{k} , s_{l} \right) : \left\| s_{k} - s_{l} \right\| \approx h \right\}$ について、以下を経験的セミバリオグラムという。 $$ \hat{\gamma} \left( h \right) = {{ 1 } \over { 2 \left| N \left( h \right) \right| }} \sum_{ \left( s_{k} , s_{l} \right) \in N \left( h \right) } \left[ Y \left( s_{k} \right) - Y \left( s_{l} \right) \right]^{2} $$ 横軸を$h$、縦軸を$\hat{\gamma} \left( h \right)$ にして描かれた図自体をセミバリオグラムとも呼ぶ。


  • 集合$X$ で使用される絶対値記号 $\left| X \right|$ は、集合の濃度を意味する。

説明

本質的に2つの定義は同じで、上側がもう少し正確に書かれており、下側がもう少し一般的に書かれていると考えればいい。直接コードを書きたいわけではなければ、どちらの定義を見ても問題ないし、視覚化の用途が異なるとしても、結局は別のものになることはない。

$\gamma_{ij}^{\ast} \to$ ESC

ESCの図は、経験的バリオグラムを地図に合わせて視覚化したもので、異方性の検出など、探索的データ分析に役立つ。等高線が丸く表示されれば、アイソトロピックであり、楕円形に表示されれば、異方性が予想される。

$\hat{\gamma} (h) \to$ セミバリオグラム

そもそもセミバリオグラムという言葉の-グラム自体が図解を意味するが、これは上の図に由来する。もう少し詳細な内容は、セミバリオグラムのモデルについて扱ったポストで取り上げることにする。


  1. Banerjee. (2015). Hierarchical Modeling and Analysis for Spatial Data(2nd Edition): p39. ↩︎

  2. https://juliaearth.github.io/GeoStats.jl/stable/variography/empirical.html ↩︎