logo

최적값: 최대값과 최소값 📂최적화이론

최적값: 최대값과 최소값

쉬운 정의

최대값maximum최소값minimum을 통틀어 최적값optimum이라 한다.

  • 집합 $X$ 에서 가장 큰 원소를 최대값 $\max X$, 가장 작은 원소를 최소값 $\min X$ 과 같이 나타낸다.
  • 함수 $f : X \to \mathbb{R}$ 의 가장 큰 함수값을 $\max_{X} f$, 가장 작은 함수값을 $\min_{X} f$ 와 같이 나타낸다.

  • $\mathbb{R}$ 은 실수 전체의 집합을 나타낸다.
  • 최대, 최소는 한자어고 값은 순우리말이므로 사실 2021년 기준으로는 최댓값, 최솟값이 맞으나, 검색엔진에 별로 친화적이지 않아 ㅅ을 뺐다. 마찬가지로 그냥 値값 치자를 써서 최대치, 최소치라 써도 되지만 현재 언어습관에 가장 익숙할 순화를 골랐다.

설명

수학자들의 관점에서 큰 걸 찾느냐 작은 걸 찾느냐는 건 사실 큰 의미가 없다. 특히 최적화 문제에서는 알고리즘 전반을 설명할 때 최대화를 하든 최소화를 하든 구분하지 않고 그냥 최적화한다고 말한다.

Maximum의 복수형은 Maxima, Minimum의 복수형은 Minima, Optimum의 복수형은 Optima다. 최적값이 여러개 있는 게 말이 안 되니 이런 표현들이 쓰였을 땐 맥락 상 최적값value이 아니라 최적점point이라고 보아야한다.

최적값은 극값과 대비되는 표현으로써, 최적화 문제의 맥락에서는 이 포스트에서의 최적값이 전역global 최적값, 극값이 국소local 최적값으로 볼릴 수도 있다. 보통 이런 맥락에서 전역이라는 말은 큰 의미가 없다.

맥락 상 값과 집합 자체가 중요하지 않을 땐 집합, 원소, 함수 표현이 제멋대로인 경우가 많으니 정신 잘 차려야한다.

이 포스트의 의의는 사실 어릴적부터 친숙하게 써온 최대값과 최소값을 모호하지 않은 함수의 형태로 정의하는 것에 있다. 위의 간단한 정의에 직관적으로 동의할 수 있다면 다음의 어려운 정의도 함께 보자.

어려운 정의

집합의 최적값

전순서집합 $\left( Y, \le \right)$ 가 주어져 있다고 하자.

$\max, \min : 2^{Y} \to Y$ 는 $Y$ 의 각 부분집합 $A \in 2^{Y}$ 에 대해 $B$ 의 가장 작은 원소나 가장 큰 원소인 $y_{\ast} \in B$ 로 대응시키는 함수다. $$ \max : B \mapsto y_{\ast} \ge b \qquad , \forall b \in B \\ \min : B \mapsto y_{\ast} \le b \qquad , \forall b \in B $$

함수의 최적값

집합 $X$ 이 정의역이고 $Y$ 가 공역인 함수들의 집합 $Y^{X}$ 이 주어져 있다고 하자.

$A \subset X$ 에 대해 $\max_{A}, \min_{A} : Y^{X} \to Y$ 는 함수 $f : X \to Y$, 즉 $f \in Y^{X}$ 에 대해 다음과 같이 정의된다. $$ \max_{A} f = \max f(A) \\ \min_{A} f = \min f(A) $$


  • $f(A)$ 는 $A$ 에 대한 $f$ 의 이미지로써, 다음과 같이 정의된다. $$ f(A) := \left\{ f(a) : \forall a \in A \right\} $$

예시

집합 $[0,1)$ 에 대해 최대값은 존재하지 않으며, 최소값은 $\min [0, 1) = 0$ 이다.

이차함수 $f(x) := 2x^{2} + 1$ 의 최소값은 $\min_{\mathbb{R}} f = f(0) = 1$ 이다. 별도로 $A = [2,3] \subset \mathbb{R}$ 안에서 최대값을 생각하면 $\max_{a \in A} f(a) = f(2) = 9$ 다.

위 예시들에서도 표기가 엉망인데, 설명한 것과 같이 보통은 대강 넘어가도 상관 없다.