最適解：最大因数と最小因数 📂最適化理論

最適解：最大因数と最小因数

難しい定義

任意の集合$X$と全順序集合$\left( Y, \le \right)$が与えられているとしよう。

$X$の部分集合$S \subset X$について、関数$f : X \to Y$の最大引数 $\argmax_{S} : Y^{X} \to 2^{X}$と最小引数 $\argmin_{S} : Y^{X} \to 2^{X}$は以下のように定義される。 $$ \argmax_{S} f := \left\{ x_{\ast} \in S : f \left( x_{\ast} \right) \ge f(x) , \forall x \in X \right\} \\ \argmin_{S} f := \left\{ x_{\ast} \in S : f \left( x_{\ast} \right) \le f(x) , \forall x \in X \right\} $$

$2^{X}$は$X$の冪集合、$Y^{X}$は定義域が$X$で値域が$Y$の関数の集合だ。
「最大引数」という表現は全くオフィシャルではなく、適切な表現がないため筆者が勝手に付けたものだ。

説明

統計学を勉強しているなら、最尤推定法で初めて出会うことになるだろう。

最大引数と最小引数をまとめて最適解とも呼ぶ。これは、関数の最大値や最小値を求める最適化問題で、最大引数と最小引数が解集合になるからだ。

最初に関数がアルファベットを六文字も使うから、見た目が怖い。上の定義は、可能な限り最も一般的で難しい言葉で書かれているが、簡単に言えば、単に関数の値が最も大きくまたは最も小さくなる点にすぎない。

紹介された定義はWikipediaを見ても似ているが、正直なところ、冪集合、関数集合、全順序集合などを述べて過度に複雑に定義する必要はない。書く人は楽かもしれないが、読む人には全く役に立たない。直接例を見て理解しよう。

簡単な例

例えば$f(x) := \left| (x-a)(x-b) \right|$とすると、$f : \mathbb{R} \to \mathbb{R}$は$a,b$で最小値$f(a) = f(b) = 0$を持つ。全ての実数$x \in \mathbb{R}$に対して不等式$f(a) = f(b) \le f(x)$が成立するので、$f$の最小引数は次のように表せる。 $$ \argmin_{\mathbb{R}} f = \left\{ a, b \right\} $$

値域が冪集合である理由

上の例で見たように、関数の最小値が存在するかもしれないし、しないかもしれないが、存在するならばそれは一意である。しかし、関数が単射でなければ、同じ値に対応する引数が複数存在する可能性があるためだ。