logo

最適解:最大因数と最小因数 📂最適化理論

最適解:最大因数と最小因数

難しい定義

任意の集合XX全順序集合(Y,)\left( Y, \le \right)が与えられているとしよう。

XXの部分集合SXS \subset Xについて、関数f:XYf : X \to Y最大引数 arg maxS:YX2X\argmax_{S} : Y^{X} \to 2^{X}最小引数 arg minS:YX2X\argmin_{S} : Y^{X} \to 2^{X}は以下のように定義される。 arg maxSf:={xS:f(x)f(x),xX}arg minSf:={xS:f(x)f(x),xX} \argmax_{S} f := \left\{ x_{\ast} \in S : f \left( x_{\ast} \right) \ge f(x) , \forall x \in X \right\} \\ \argmin_{S} f := \left\{ x_{\ast} \in S : f \left( x_{\ast} \right) \le f(x) , \forall x \in X \right\}


  • 2X2^{X}XXの冪集合、YXY^{X}は定義域がXXで値域がYY関数の集合だ。
  • 「最大引数」という表現は全くオフィシャルではなく、適切な表現がないため筆者が勝手に付けたものだ。

説明

統計学を勉強しているなら、最尤推定法で初めて出会うことになるだろう。

最大引数と最小引数をまとめて最適解とも呼ぶ。これは、関数の最大値や最小値を求める最適化問題で、最大引数と最小引数が解集合になるからだ。

最初に関数がアルファベットを六文字も使うから、見た目が怖い。上の定義は、可能な限り最も一般的で難しい言葉で書かれているが、簡単に言えば、単に関数の値が最も大きくまたは最も小さくなる点にすぎない。

紹介された定義はWikipediaを見ても似ているが、正直なところ、冪集合、関数集合、全順序集合などを述べて過度に複雑に定義する必要はない。書く人は楽かもしれないが、読む人には全く役に立たない。直接例を見て理解しよう。

簡単な例

例えばf(x):=(xa)(xb)f(x) := \left| (x-a)(x-b) \right|とすると、f:RRf : \mathbb{R} \to \mathbb{R}a,ba,b最小値f(a)=f(b)=0f(a) = f(b) = 0を持つ。全ての実数xRx \in \mathbb{R}に対して不等式f(a)=f(b)f(x)f(a) = f(b) \le f(x)が成立するので、ffの最小引数は次のように表せる。 arg minRf={a,b} \argmin_{\mathbb{R}} f = \left\{ a, b \right\}

値域が冪集合である理由

上の例で見たように、関数の最小値が存在するかもしれないし、しないかもしれないが、存在するならばそれは一意である。しかし、関数が単射でなければ、同じ値に対応する引数が複数存在する可能性があるためだ。