空間過程の定常性
定義 1
Euclidean 空間の固定された部分集合 $D \subset \mathbb{R}^{r}$における確率変数 $Y(s) : \Omega \to \mathbb{R}^{1}$の集合である空間過程 $\left\{ Y(s) \right\}_{s \in D}$と方向ベクトル $\mathbf{h} \in \mathbb{R}^{r}$を考えよう。具体的に $n \in \mathbb{N}$ 個のサイトを $\left\{ s_{1} , \cdots , s_{n} \right\} \subset D$のように表し、$Y(s)$ が全ての $s \in D$に対して分散が存在すると仮定する。
- 全ての $\left\{ s_{1} , \cdots , s_{n} \right\}$ と全ての $\mathbf{h}$ に対して以下の二つのランダムベクトルの分布が同じならば、$\left\{ Y(s) \right\}$ は 強い定常性を持つと言われる。 $$ \left( Y \left( s_{1} \right) , \cdots , Y \left( s_{n} \right) \right) \\ \left( Y \left( s_{1} + \mathbf{h} \right) , \cdots , Y \left( s_{n} + \mathbf{h} \right) \right) $$
- 全ての $s \in D$で $\mu (s)$ が定数関数 $\mu (s) := \mu$ であり、かつ $s , s + \mathbf{h}$ 両方が $D$ に属している場合、全ての $\mathbf{h}$ に対する共分散がある関数 $C$ によって $s$ に無関係に $\mathbf{h}$ のみの関数 $C : \mathbb{R}^{r} \to \mathbb{R}$ として表されるとき、$\left\{ Y(s) \right\}$ は 弱い定常性を持つとされる。 $$ \operatorname{Cov} \left( Y (s) , Y \left( s + \mathbf{h} \right) \right) = C \left( \mathbf{h} \right) $$ ここで、$C$を共分散関数あるいはバリオグラムと呼ぶ。特に $\left\| \mathbf{h} \right\| \to \infty$ の時 $C \left( \mathbf{h} \right) \to 0$ であれば、$\left\{ Y(s) \right\}$ は エルゴード的であると言う。
- $\left[ Y \left( s + \mathbf{h} \right) - Y(s) \right]$ の平均が $0$ であり分散が唯一 $\mathbf{h}$ に依存する場合、$\left\{ Y(s) \right\}$ は 内在的定常性を持つと言われる。 $$ \begin{align*} E \left[ Y \left( s + \mathbf{h} \right) - Y(s) \right] =& 0 \\ \operatorname{Var} \left[ Y \left( s + \mathbf{h} \right) - Y(s) \right] =& 2 \gamma ( \mathbf{h} ) \end{align*} $$
- $2 \gamma \left( \mathbf{h} \right)$ をバリオグラムと呼ぶ。
定理
強い定常性を持つ空間過程は弱い定常性を持っており、弱い定常性過程は内在的である。 $$ \text{Strong} \implies \text{Weak} \implies \text{Intrinsic} $$ また、全ての $\left\{ s_{1} , \cdots , s_{n} \right\}$ に対するランダムベクトル $\left( Y \left( s_{1} \right) , \cdots , Y \left( s_{n} \right) \right)$ が多変量正規分布に従う場合、$\left\{ Y(s) \right\}$ はガウス型である。弱い定常性空間過程が強い定常性になるための必要十分条件は、空間過程がガウス型であることである。 $$ \text{Strong} \overset{\text{gaussian}}{\impliedby} \text{Weak} $$
説明
定常性が必要な理由
時系列分析の定常性が様々なモデルの仮定になったのと同様に、空間過程の定常性も空間データの分析に先立って当然満たされなければならない性質を指す。定常性を仮定できない場合、多くの場合で分析自体が無意味になる。
- 強い定常性は文字通り定常性そのものだ。問題は、理論的にこれが本当の定常性であるとしても、現実の中でその例を見つけるのが難しいかもしれないことであり、弱い定常性という緩やかな条件に退く必要がある。
- 弱い定常性は、全てのサイトでの分布は知らなくても、少なくとも平均が一定でその共分散が相対的な距離と方向 $\mathbf{h}$ にのみ依存すればよいという妥協である。
- 内在的定常性の内在的という表現は統計学だけを勉強していた人には新しいかもしれないが、次の定義と似ている観点から、観測された二点間の差が単に $\mathbf{h}$ にのみ依存するという点で'内在的'と呼ばれるに値する。
内在的関数の定義: 微分幾何学で、(単位法線 $\mathbf{n}$には依存せずに) 第一基本形式の係数 $g_{ij}$にのみ依存する関数を内在的と呼ぶ。
エルゴード性
エルゴード(Ergodic)の発音は韓国語で[얼가딕]に近いが、それはさておき。
空間過程がエルゴード的であること、すなわち $$ \lim_{\left\| \mathbf{h} \right\| \to \infty} C \left( \mathbf{h} \right) = 0 $$ とは、方向がどうであれ、二つのサイト間の距離が離れるにつれて、その相関関係が減少するという仮定である。これはかなり合理的な仮定である。全てのデータがエルゴード的なわけではないが、直感的には、$C \left( \mathbf{h} \right)$が周期性を持つか、非常に特異な例でない限り、距離が離れるほど関係が弱くなることは一般的である。$C \left( \mathbf{h} \right) \searrow \varepsilon$程度は、限界的な意味で期待しても良さそうだ。
確率過程でのエルゴードは通常、時間 $t$ に依存するものと見なされ、長い時間が経った後($t \to \infty$)に特定の状態が最初の状態に戻るという概念に似た形で接近している。同様に、空間過程では時間ではなく、遠くの距離($\left\| \mathbf{h} \right\| \to \infty$)で互いに相関関係が減少するという形で扱われている。もちろん、多くの分野でエルゴード性を時間と初期状態と関連づけて説明するのは事実だが、全く強引な命名ではない。
Banerjee. (2003). Hierarchical Modeling and Analysis for Spatial Data: p23~24. ↩︎