平均と分散の別の定義
定義
ユークリッド空間 $\mathbb{R}$ 1
確率変数 $X :\Omega \to \mathbb{R}$ について偏差自乗の期待値の下限 $\sigma^{2} (X) \in \mathbb{R}$ を $X$ の分散varianceと定義する。 $$ \sigma^{2} \left( X \right) := \inf_{a \in \mathbb{R}} E \left[ \left( X - a \right)^{2} \right] $$ 偏差自乗の期待値を最小化する値 $\mu (X) \in \mathbb{R}$ を平均meanと定義する。 $$ \mu \left( X \right) := \argmin_{a \in \mathbb{R}} E \left[ \left( X - a \right)^{2} \right] $$
一般的な空間 $\mathcal{R}$
確率元素 $X : \Omega \to \mathcal{R}$ について偏差自乗の期待値の下限 $\sigma^{2} (X) \in \mathbb{R}$ を $X$ の分散と定義し、偏差自乗の期待値を最小化する $\mu (X) \in \mathcal{R}$ を平均と定義する。
説明
本来の一般的な確率論では、ファーストモーメントとして平均を定義した後、平均と偏差自乗和として分散を定義する。偶然かどうかは分からないが、平均は偏差自乗和を最小化する性質を持っており、実際に証明することもできる。しかし、このポストでは先に分散を定義し、偏差自乗の期待値を最小化することを平均と定義するが、$\mathbb{R}^{n}$ ではなく多様体などを考えればむしろこの方が最小二乗という意味でより自然だ。
$X : \Omega \to \mathcal{R}$ に関する分散と平均の定義によれば、平均はもはや一意でない可能性がある。例えば球面 $S^{2}$ 上の確率分布であるフィッシャー分布を考えてみよう。球面上のある点 $\mu$ の正反対に位置する点を $- \mu$ と表すと、$X \sim \text{vMF}_{3} \left( \mu , \kappa \right)$ であり、$Y \sim \text{vMF}_{3} \left( -\mu , \kappa \right)$ であるとき、$X + Y$ は $\mu$ と $-\mu$ の両方を平均として持っても全く問題ない。
先の例で興味深い点は、「平均」という言葉自体の意味が既に色褪せていることである。$\mathbb{R}$ 以外の世界で平均は単なる平均ではなく、平均ベクトル、平均行列、平均グラフなどの様々な表現があるかもしれない。しかし分散は確率元素がどのような $\mathcal{R}$ で定義されていても、依然として散らばりdispersionを示す概念として常に実数の値を持つ。この観点から見ると、分散こそが本質的で核心的な概念であり、平均より先に定義されるのが当然だ。
Gerald B. Folland, Real Analysis: Modern Techniques and Their Applications (2nd Edition, 1999): p314 ↩︎