일반적인 컨벡스 함수의 정의
📂함수일반적인 컨벡스 함수의 정의
정의
벡터공간 V 에서 정의된 함수 f:V→R 가 모든 x,y∈V 와 모든 t∈[0,1] 에 대해 다음을 만족하면 컨벡스 함수convex Funciton라 한다.
f((1−t)x+ty)≤(1−t)f(x)+tf(y)
설명
사실 학부수준 이상의 수학을 공부하게 되면 볼록이나 오목이라는 표현은 물론, 컨벡스convex가 아닌 컨케이브concave도 사용하지 않게 된다. 어지간하면 모든 개념을 컨벡스로 통일하며, 컨벡스만을 생각한다. 위에서 소개된 컨벡스 함수는 유클리드 공간 X=R 에서 정의된 볼록함수의 일반화다.
예시
근의 집합이 포물면을 이루는 f(x,y):=x2+y2 은 컨벡스 함수고, 그 값이 최소가 되는 점은 (x,y)=(0,0) 이다.
정리
컨벡스 집합에서의 컨벡스 함수의 최적해
f:Rn→R 이 미분가능한 컨벡스 함수고, 컨벡스 집합 C⊂Rn 이 컨벡스 집합이라 하면 다음 둘은 동치다.
- x∗∈C 는 C 에서 f 를 최소화하는 최적해다.
- 모든 x∈C 에 대해
∇f(x∗)(x−x∗)≥0
증명
(⟹)
x(t):=x∗+t(x−x∗)∈C,t∈[0,1]
C 는 컨벡스 집합이라 가정했으므로, 임의의 x∈C 와 x∗ 사이의 어떤 내분점 x(t) 는 위와 같이 나타낼 수 있다. 한편
- x∗=argminx∈Cf 이므로 모든 x∈C 에 대해 f(x(t))−f(x∗)≥0 이고
- f(x(t)) 의 t=0 에서의 편미분계수는 연쇄법칙에 따라 ∇f(x∗)(x−x∗) 이므로
==≥∇f(x∗)(x−x∗)[∂t∂f(x(t))]t=0t→0limtf(x(t))−f(x∗)0
즉 ∇f(x∗)(x−x∗)≥0 을 얻는다.
(⟸)
f((1−t)z+ty)≤(1−t)f(z)+tf(y)
의 양변을 t 로 미분해보면
(−z+y)∇f((1−t)z+ty)≤−f(z)+f(y)
이므로, t=0 일때 다음을 얻는다.
f(z)+∇f(z)(y−z)≤f(y)
가정에서 ∇f(x∗)(x−x∗)≥0 이므로 y=x 와 z=x∗ 에 대해 다음을 얻는다.
≤≤f(x∗)+0f(x∗)+∇f(x∗)(x−x∗)f(x)
즉 f(x∗)≤f(x) 인데, 이는 모든 x∈C 에 대해 성립하므로 x∗ 는 C 에서 f 의 최소해가 된다.
■