르장드르 변환
📂편미분방정식 르장드르 변환 x와 p에 대해서, 편미분방정식의 변수임을 강조할 때는 일반 글씨체 x , p ∈ R n x,p \in \mathbb{R}^{n} x , p ∈ R n 으로 표기하고, s s s 에 대한 함수임을 강조할 때는 굵은 글씨체 x , p ∈ R n \mathbf{x}, \mathbf{p} \in \mathbb{R}^{n} x , p ∈ R n 으로 표기한다. 정의 우선 단순함을 위해 라그랑지안 을 변수 v ∈ R n v\in \mathbb{R}^{n} v ∈ R n 만을 가지는 함수라고 하자.
L ( v ) = L : R n → R
L(v) = L : \mathbb{R}^{n} \to \mathbb{R}
L ( v ) = L : R n → R
라그랑지안 L L L 이 아래의 두 조건을 만족한다고 하자
(a) L L L 이 볼록함수 이다.
λ L ( v 1 ) + ( 1 − λ ) L ( v 2 ) ≤ L ( λ v 1 + ( 1 − λ ) v 2 ) ∀ v 1 , v 2 ∈ R n , ∀ 0 ≤ λ ≤ 1
\lambda L(v_{1}) + (1-\lambda)L(v_{2}) \le L\big( \lambda v_{1} +(1-\lambda)v_{2} \big) \quad \forall\ v_{1},v_{2}\in \mathbb{R}^{n},\quad \forall\ 0\le \lambda \le 1
λ L ( v 1 ) + ( 1 − λ ) L ( v 2 ) ≤ L ( λ v 1 + ( 1 − λ ) v 2 ) ∀ v 1 , v 2 ∈ R n , ∀ 0 ≤ λ ≤ 1
(b) lim ∣ v ∣ → ∞ L ( v ) ∣ v ∣ = + ∞ \lim \limits_{ |v|\to \infty} \dfrac{ L(v) }{ |v| }=+\infty ∣ v ∣ → ∞ lim ∣ v ∣ L ( v ) = + ∞
그러면 L L L 의 르장드르 변환 Legendre transform L ∗ : R n → R L^{\ast} : \mathbb{R}^{n} \to \mathbb{R} L ∗ : R n → R 을 다음과 같이 정의한다.
L ∗ ( p ) : = sup v ∈ R n { p ⋅ v − L ( v ) } ∀ p ∈ R n
L^{\ast} (p) := \sup \limits_{v \in \mathbb{R}^{n}} \left\{ p\cdot v -L(v) \right\} \quad \forall \ p \in \mathbb{R}^{n}
L ∗ ( p ) := v ∈ R n sup { p ⋅ v − L ( v ) } ∀ p ∈ R n
펜셸 변환 Fenchel transform 이라고도 한다.
설명 이 때 p p p 는 해밀토니안 의 변수인 p = D v L ( x ˙ , x ) \mathbf{p}= D_{v}L\big( \dot{\mathbf{x}},\ \mathbf{x}\big) p = D v L ( x ˙ , x ) 와 같다. L ∗ L^{\ast} L ∗ 가 잘 정의됨은 다음과 같이 증명할 수 있다. 또한 sup \sup sup 으로 정의했지만 실제로 max \max max 와 같다는 것도 보일 수 있다.
정리 르장드르 변환 L ∗ ( p ) L^{\ast}(p) L ∗ ( p ) 는 잘 정의된다. 또한 sup { p ⋅ v − L ( v ) } = max { p ⋅ v − L ( v ) } \sup \left\{ p\cdot v -L(v) \right\} = \max \left\{ p\cdot v -L(v) \right\} sup { p ⋅ v − L ( v ) } = max { p ⋅ v − L ( v ) } 가 성립한다.
증명 잘 정의됨 L ∗ ( p ) L^{\ast}(p) L ∗ ( p ) 가 실숫값을 가짐을 귀류법으로 증명한다. 조건 (a) 에 의해 L L L 이 연속이라는 사실은 자명하다. 그리고 르장드르 변환의 정의( sup ) (\sup) ( sup ) 에 의해 − ∞ -\infty − ∞ 는 값으로 가질 수 없다.
L ∗ ( p ) = sup { p ⋅ v − L ( v ) } ∈ ( − ∞ , ∞ ]
L^{\ast}(p) = \sup \left\{ p\cdot v -L(v) \right\} \in (-\infty, \infty]
L ∗ ( p ) = sup { p ⋅ v − L ( v ) } ∈ ( − ∞ , ∞ ]
이제 L ∗ ( p ) = ∞ L^{\ast}(p)=\infty L ∗ ( p ) = ∞ 라고 가정하고 모순임을 보이면 실숫값을 가짐을 증명한 것이 된다.
L ∗ ( p ) = ∞ L^{\ast}(p)=\infty L ∗ ( p ) = ∞ 라고 가정하자. 그러면 아래의 조건을 만족시키는 수열 { v k } k = 1 ∞ \left\{ v_{k} \right\}_{k=1}^\infty { v k } k = 1 ∞ 가 존재한다.
a k : = p ⋅ v k − L ( v k ) → ∞ as k → ∞
\begin{equation}
a_{k}:= p\cdot v_{k} -L(v_{k}) \to \infty \quad \text{as } k \to \infty
\label{eq1}
\end{equation}
a k := p ⋅ v k − L ( v k ) → ∞ as k → ∞
그리고 모든 k k k 에 대해서 v k ≠ 0 v_{k} \ne 0 v k = 0 이라고 가정하자. 이렇게 가정해도 되는 이유는 a k → ∞ a_{k} \to \infty a k → ∞ 이기 때문에 v k = 0 v_{k}=0 v k = 0 인 경우는 많아봐야 유한개만큼이고 이를 제외한 부분수열을 다시 v k v_{k} v k 라고 둘 수 있기 때문이다. 이제 { v k } \left\{ v_{k} \right\} { v k } 가 유계이거나 유계가 아니거나 두 가지의 경우가 있다. 두 경우 모두 모순이 생김을 보이면 증명이 끝난다.
Case 1. { v k } \left\{ v_{k} \right\} { v k } 가 유계인 경우
{ v k } \left\{ v_{k} \right\} { v k } 가 유계이므로 어느 점으로 수렴하는 부분수열이 존재하고 이를 다시 v k v_{k} v k 라고 하자. 그러면 다음과 같은 { v k } \left\{ v_{k} \right\} { v k } 가 존재한다.
v k → v 0 as k → ∞ , f o r s o m e v 0 ∈ R n
v_{k} \to v_{0} \quad \text{as } k \to \infty,\quad \mathrm{for\ some}\ v_{0}\in \mathbb{R}^{n}
v k → v 0 as k → ∞ , for some v 0 ∈ R n
그러면 L L L 이 연속이므로 a k → p ⋅ v 0 − L ( v 0 ) ∈ R n as k → ∞ a_{k} \to p \cdot v_{0} -L(v_{0}) \in \mathbb{R}^{n} \quad \text{as } k \to \infty a k → p ⋅ v 0 − L ( v 0 ) ∈ R n as k → ∞ 이고 이는 ( eq1 ) \eqref{eq1} ( eq1 ) 에 의해서 모순이다.
Case 2. { v k } \left\{ v_{k} \right\} { v k } 가 유계가 아닌 경우
유계가 아니므로 다음과 같이 가정할 수 있다.
∣ v k ∣ → ∞ as k → ∞
|v_{k}| \to \infty \quad \text{as } k \to \infty
∣ v k ∣ → ∞ as k → ∞
가정에 의해 ∣ v k ∣ ≠ 0 |v_{k}| \ne 0 ∣ v k ∣ = 0 이므로 a k = p ⋅ v k − L ( v k ) a_{k}=p \cdot v_{k}-L(v_{k}) a k = p ⋅ v k − L ( v k ) 의 양변을 ∣ v k ∣ |v_{k}| ∣ v k ∣ 로 나누면 다음과 같다.
a k ∣ v k ∣ = p ⋅ v k ∣ v k ∣ − L ( v k ) ∣ v k ∣
\dfrac{a_{k}}{|v_{k}|}=\dfrac{p\cdot v_{k}}{|v_{k}|}-\dfrac{L(v_{k})}{|v_{k}|}
∣ v k ∣ a k = ∣ v k ∣ p ⋅ v k − ∣ v k ∣ L ( v k )
여기서 우변의 첫번째 항에 대해서 코시슈바르츠 부등식 을 적용하면 다음과 같다.
∣ p ⋅ v k ∣ v k ∣ ∣ ≤ ∣ p ∣ ∣ v k ∣ v k ∣ ∣ = ∣ p ∣
\left| \dfrac{p\cdot v_{k}}{|v_{k}|} \right| \le |p| \left| \dfrac{v_{k}}{|v_{k}|}\right| = | p |
∣ v k ∣ p ⋅ v k ≤ ∣ p ∣ ∣ v k ∣ v k = ∣ p ∣
그러면 k → ∞ k \to \infty k → ∞ 인 극한을 취하면, (b) 에 의해 다음을 얻는다.
lim ∣ v k ∣ → ∞ a k ∣ v k ∣ ≤ lim ∣ v k ∣ → ∞ ∣ p ∣ − L ( v k ) ∣ v k ∣ = − ∞
\lim \limits_{ |v_{k}|\to \infty} \dfrac{a_{k}}{|v_{k}|} \le \lim \limits_{ |v_{k}|\to \infty} |p| -\dfrac{L(v_{k})}{|v_{k}|} = -\infty
∣ v k ∣ → ∞ lim ∣ v k ∣ a k ≤ ∣ v k ∣ → ∞ lim ∣ p ∣ − ∣ v k ∣ L ( v k ) = − ∞
이 때 ∣ v k ∣ = ∞ |v_{k}|=\infty ∣ v k ∣ = ∞ 라는 가정에 의해 a k a_{k} a k 는 더 빠르게 − ∞ -\infty − ∞ 로 발산해야한다. 그런데 이는 ( eq1 ) \eqref{eq1} ( eq1 ) 과 모순이다.
가능한 두 경우에 대해서 모두 모순이므로 가정 L ∗ ( p ) = ∞ L^{\ast}(p)=\infty L ∗ ( p ) = ∞ 가 틀렸음을 알 수 있다. 따라서 르장드르 변환은 잘 정의된다.
L ∗ ( p ) ∈ R
L^{\ast}(p) \in \mathbb{R}
L ∗ ( p ) ∈ R
■
sup = max \sup=\max sup = max 이는 다음의 조건을 만족하는 v p ∈ R n v_{p} \in \mathbb{R}^{n} v p ∈ R n 이 존재함을 보이는 것과 같다.
L ∗ ( p ) = p ⋅ v p − L ( v p )
L^{\ast}(p) = p\cdot v_{p}-L(v_{p})
L ∗ ( p ) = p ⋅ v p − L ( v p )
우선 르장드르 변환의 정의( sup ) (\sup) ( sup ) 에 의해 아래의 조건을 만족하는 수열 { v k } \left\{ v_{k} \right\} { v k } 가 존재한다.
a k : = p ⋅ v k − L ( v k ) → L ∗ ( p ) as k → ∞
\begin{equation}
a_{k} := p\cdot v_{k}-L(v_{k}) \to L^{\ast}(p) \quad \text{as } k \to \infty
\label{eq2}
\end{equation}
a k := p ⋅ v k − L ( v k ) → L ∗ ( p ) as k → ∞
우선 { v k } \left\{ v_{k} \right\} { v k } 가 유계가 아니라고 가정해보자. 그러면 ∣ v k ∣ → ∞ |v_{k}| \to \infty ∣ v k ∣ → ∞ 이고 위에서 보였던 바와 같이 a k → − ∞ a_{k} \to -\infty a k → − ∞ 이고 이는 모순이다. 따라서 { v k } \left\{ v_{k} \right\} { v k } 는 유계이다. { v k } \left\{ v_{k} \right\} { v k } 가 유계이므로 v k → v p v_{k} \to v_{p} v k → v p 로 수렴하는 부분수열이 존재한다. 따라서 다음이 성립한다.
p ⋅ v k − L ( v k ) → p ⋅ v p − L ( v p ) as k → ∞
p\cdot v_{k} - L(v_{k}) \to p \cdot v_{p} -L(v_{p}) \quad \text{as } k \to \infty
p ⋅ v k − L ( v k ) → p ⋅ v p − L ( v p ) as k → ∞
그런데 ( eq2 ) \eqref{eq2} ( eq2 ) 에서 p ⋅ v k − L ( v k ) → L ∗ ( p ) p\cdot v_{k}-L(v_{k}) \to L^{\ast}(p) p ⋅ v k − L ( v k ) → L ∗ ( p ) 였으므로 다음이 성립한다.
p ⋅ v p − L ( v p ) = L ∗ ( p )
p \cdot v_{p} -L(v_{p})=L^{\ast}(p)
p ⋅ v p − L ( v p ) = L ∗ ( p )
■