스칼라 필드의 그래디언트
📂다변수벡터해석 스칼라 필드의 그래디언트 정의 스칼라 필드 f : R n → R f : \mathbb{R}^{n} \to \mathbb{R} f : R n → R 의 전 도함수 를 특별히 그래디언트 gradient, 기울기 라 부르고 ∇ f \nabla f ∇ f 라 표기한다.
∇ f : = f ′ = [ D 1 f D 2 f ⋯ D n f ] = [ ∂ f ∂ x 1 ∂ f ∂ x 2 ⋯ ∂ f ∂ x n ] = ∂ f ∂ x 1 x ^ 1 + ∂ f ∂ x 2 x ^ 2 + ⋯ + ∂ f ∂ x n x ^ n
\begin{align*}
\nabla f := f^{\prime} =& \begin{bmatrix} D_{1}f & D_{2}f & \cdots & D_{n}f\end{bmatrix}
\\ =& \begin{bmatrix} \dfrac{\partial f}{\partial x_{1}} & \dfrac{\partial f}{\partial x_{2}} & \cdots & \dfrac{\partial f}{\partial x_{n}} \end{bmatrix}
\\ =& \dfrac{\partial f}{\partial x_{1}}\hat{x}_{1} + \dfrac{\partial f}{\partial x_{2}}\hat{x}_{2} + \dots + \dfrac{\partial f}{\partial x_{n}}\hat{x}_{n}
\end{align*}
∇ f := f ′ = = = [ D 1 f D 2 f ⋯ D n f ] [ ∂ x 1 ∂ f ∂ x 2 ∂ f ⋯ ∂ x n ∂ f ] ∂ x 1 ∂ f x ^ 1 + ∂ x 2 ∂ f x ^ 2 + ⋯ + ∂ x n ∂ f x ^ n
설명 그래디언트는 쉽게 말해 다변수 함수의 도함수다. 물리학 등에서 자주 쓰이는 3차원 스칼라 함수의 그래디언트는 다음과 같다.
∇ f = ∂ f ∂ x x ^ + ∂ f ∂ y y ^ + ∂ f ∂ z z ^ = ( ∂ f ∂ x , ∂ f ∂ y , ∂ f ∂ z )
\nabla f = \dfrac{\partial f}{\partial x}\hat{\mathbf{x}} + \dfrac{\partial f}{\partial y}\hat{\mathbf{y}} + \dfrac{\partial f}{\partial z}\hat{\mathbf{z}} = \left( \dfrac{\partial f}{\partial x}, \dfrac{\partial f}{\partial y}, \dfrac{\partial f}{\partial z} \right)
∇ f = ∂ x ∂ f x ^ + ∂ y ∂ f y ^ + ∂ z ∂ f z ^ = ( ∂ x ∂ f , ∂ y ∂ f , ∂ z ∂ f )
주목할만한 점은 함숫값이 스칼라인 스칼라함수의 도함수가 함숫값이 벡터인 벡터함수가 된다는 것이다. 이는 전 도함수의 정의로부터 당연하다고도 볼 수 있지만 직관적으로도 이해할 수 있다.
예시로써 위의 그림을 생각해보자. 위 그림은 z ( x , y ) = x 2 − y 2 z(x,y) = x^2 - y^2 z ( x , y ) = x 2 − y 2 와 같이 정의된 함수 z : R 2 → R z : \mathbb{R}^{2} \to \mathbb{R} z : R 2 → R 을 시각적으로 나타낸 것이다. y = f ( x ) y = f(x) y = f ( x ) 와 같은 꼴의 일변수함수와는 달리, 변수가 2개이상인 함수의 변화율을 생각할 때는 그 크기뿐 아니라 방향까지도 생각해야함을 알 수 있다.
이러한 개념을 반영한 방향 도함수 는 임의의 방향으로의 도함수를 의미한다. 따라서 다변수 함수는 무수히 많은 방향으로의 도함수를 가지는데, 아래의 정리 로부터 그래디언트는 그 중에서 변화율이 가장 큰 방향을 가리킴을 알 수 있다.
델 연산자 한편 ∇ \nabla ∇ 는 스칼라 함수 f f f 를 다음과 같은 벡터 함수 g = R n → R n g = \mathbb{R}^{n} \to \mathbb{R}^{n} g = R n → R n 으로 매핑하는 연산자 라고 생각할 수 있으므로 델 연산자 dell operator 라고도 불린다.
∇ : f ↦ g = ( ∂ f ∂ x 1 , ⋯ , ∂ f ∂ x n )
\nabla : f \mapsto g = \left({{ \partial f} \over { \partial x_{1} }} , \cdots , {{ \partial f} \over { \partial x_{n} }} \right)
∇ : f ↦ g = ( ∂ x 1 ∂ f , ⋯ , ∂ x n ∂ f )
∇ \nabla ∇ 기호 자체는 나블라nabla 라고 읽는다.
정리 점 x 0 ∈ R n \mathbf{x}_{0} \in \mathbb{R}^{n} x 0 ∈ R n 에서 함수 f f f 의 증가율이 가장 큰 방향을 나타낸 벡터는 ∇ f ( x 0 ) \nabla f (x_{0}) ∇ f ( x 0 ) 이다.
증명 ∥ d ∥ = 1 \left\| \mathbf{d} \right\| = 1 ∥ d ∥ = 1 이 되도록하는 방향 벡터 d : = ( d 1 , ⋯ , d n ) \mathbf{d} : = ( d_1 , \cdots , d_n ) d := ( d 1 , ⋯ , d n ) 을 정의하자. 다변수 함수의 테일러 정리에 의해
f ( x 0 + h d ) = f ( x 0 ) + h [ ∂ f ( x 0 ) ∂ x 1 d 1 + ⋯ + ∂ f ( x 0 ) ∂ x n d n ] + O ( h 2 )
f \left( x_{0} + h \mathbf{d} \right) = f ( \mathbf{x}_{0} ) + h \left[ {{ \partial f ( \mathbf{x}_{0} ) } \over { \partial x_{1} }} d_{1} + \cdots + {{ \partial f ( \mathbf{x}_{0} ) } \over { \partial x_{n} }} d_{n} \right] + O (h^2)
f ( x 0 + h d ) = f ( x 0 ) + h [ ∂ x 1 ∂ f ( x 0 ) d 1 + ⋯ + ∂ x n ∂ f ( x 0 ) d n ] + O ( h 2 )
행렬 꼴로 바꾸면
f ( x 0 + h d ) − f ( x 0 ) = h [ ∂ f ( x 0 ) ∂ x 1 ⋮ ∂ f ( x 0 ) ∂ x n ] ⋅ [ d 1 ⋮ d n ] + O ( h 2 )
f \left( x_{0} + h \mathbf{d} \right) - f ( \mathbf{x}_{0} ) = h \begin{bmatrix}
{{ \partial f ( \mathbf{x}_{0} ) } \over { \partial x_{1} }}
\\ \vdots
\\ {{ \partial f ( \mathbf{x}_{0} ) } \over { \partial x_{n} }}
\end{bmatrix} \cdot \begin{bmatrix}
d_{1}
\\ \vdots
\\ d_{n}
\end{bmatrix} + O (h^2)
f ( x 0 + h d ) − f ( x 0 ) = h ∂ x 1 ∂ f ( x 0 ) ⋮ ∂ x n ∂ f ( x 0 ) ⋅ d 1 ⋮ d n + O ( h 2 )
벡터 꼴로 바꾸면
f ( x 0 + h d ) − f ( x 0 ) h = ∇ f ( x 0 ) ⋅ d + O ( h )
{{ f \left( x_{0} + h \mathbf{d} \right) - f ( \mathbf{x}_{0} )} \over {h}} = \nabla f \left( \mathbf{x}_{0} \right) \cdot \mathbf{d} + O (h)
h f ( x 0 + h d ) − f ( x 0 ) = ∇ f ( x 0 ) ⋅ d + O ( h )
h → 0 h \to 0 h → 0 일 때
∇ f ( x 0 ) ⋅ d = lim h → 0 f ( x 0 + h d ) − f ( x 0 ) h
\nabla f \left( \mathbf{x}_{0} \right) \cdot \mathbf{d} = \lim_{h \to 0} {{ f \left( x_{0} + h \mathbf{d} \right) - f ( \mathbf{x}_{0} )} \over {h}}
∇ f ( x 0 ) ⋅ d = h → 0 lim h f ( x 0 + h d ) − f ( x 0 )
b \mathbf{b} b 가 x 0 \mathbf{x}_{0} x 0 에서 f f f 의 기울기와 같은 방향이라는 것은 d \mathbf{d} d 가
lim h → 0 f ( x 0 + h d ) − f ( x 0 ) h
\lim_{h \to 0} {{ f \left( x_{0} + h \mathbf{d} \right) - f ( \mathbf{x}_{0} )} \over {h}}
h → 0 lim h f ( x 0 + h d ) − f ( x 0 )
이 가장 커지도록 하는 단위벡터라는 뜻이다. 이를 만족하는 경우는 d = ∇ f ( x 0 ) ∥ ∇ f ( x 0 ) ∥ \displaystyle \mathbf{d} = {{\nabla f \left( \mathbf{x}_{0} \right) } \over { \left\| \nabla f \left( \mathbf{x}_{0} \right) \right\| }} d = ∥ ∇ f ( x 0 ) ∥ ∇ f ( x 0 ) 뿐이고, 따라서
∇ f ( x 0 ) = ∥ ∇ f ( x 0 ) ∥ d
\nabla f \left( \mathbf{x}_{0} \right) = \left\| \nabla f \left( \mathbf{x}_{0} \right) \right\| \mathbf{d}
∇ f ( x 0 ) = ∥ ∇ f ( x 0 ) ∥ d
은 x 0 \mathbf{x}_{0} x 0 에서 f f f 의 그래디언트가 된다.
■
같이보기