logo

3차원 데카르트 좌표계에서 스칼라 함수의 그래디언트(기울기) 📂수리물리

3차원 데카르트 좌표계에서 스칼라 함수의 그래디언트(기울기)

정의

스칼라 함수 $f=f(x,y,z)$에 대해서, 다음과 같은 벡터함수를 $f$의 그래디언트gradient, 기울기라고 정의하고 $\nabla f$라고 표기한다.

$$ \nabla f := \frac{ \partial f}{ \partial x }\hat{\mathbf{x}}+\frac{ \partial f}{ \partial y}\hat{\mathbf{y}}+\frac{ \partial f}{ \partial z}\hat{\mathbf{z}} = \left( \dfrac{\partial f}{\partial x}, \dfrac{\partial f}{\partial y}, \dfrac{\partial f}{\partial z} \right) $$

설명

그래디언트는 기울기, 구배, 물매 등으로 번역된다. 구매, 물매는 그래디언트의 옛날식 번역이고 최근에는 잘 쓰이지 않는다. 또한 구배는 기울기의 한자어이기 때문에 기울기와 같은 말이다. 그래디언트는 실제로 벡터이기 때문에 기울기라는 말은 그래디언트가 가지는 의미를 모두 담기에는 부족한 것같다. 생새우초밥집에서는 기울기라는 말 대신 그래디언트로 통일한다.

기하학적으로 $\nabla f$는 $f$가 가장 급격하게 변화하는 방향을 의미한다. 다시말해 점 $(x,y,z)$에서 $f$의 증가율이 가장 큰 방향은 벡터 $\left( \dfrac{\partial f(x,y,z)}{\partial x}, \dfrac{\partial f(x,y,z)}{\partial y}, \dfrac{\partial f(x,y,z)}{\partial z} \right)$라는 것이다. 이는 미분계수를 다차원으로의 확장한 것에 불과하다. $f$가 증가하고 있으면 미분계수가 양수, $f$가 감소하고 있으면 미분계수가 음수인 것과 같은 개념이다.

한편 정의에서 $\left( \dfrac{\partial f}{\partial x}, \dfrac{\partial f}{\partial y}, \dfrac{\partial f}{\partial z} \right)$라는 값을 $\nabla f$로 표기한다고 한 것에 주의하자. $\nabla$를 델 연산자라 부르기는 하지만, 이것 자체로 어떤 의미를 가진다고 생각하면 $\nabla \cdot \mathbf{F}$$\nabla \times \mathbf{F}$내적외적으로 오해하기 딱 좋다. 따라서 $\nabla$는 그저 편리한 표기법 정도로만 이해해야하며, 그래디언트, 다이벌전스, 컬을 묶어 델 연산자들이라고 부른다고 하거나, 차라리 델 연산자=그래디언트라고 생각하는게 더 나을 수 있다. 자세한 내용은 아래에서 이어진다.

주의할 점

$\nabla f$는 $\nabla$와 $f$의 곱이 아니다

그래디언트를 이해함에 있어서 중요한 것은 $\nabla f$가 벡터 $\nabla = (\frac{\partial }{\partial x}, \frac{\partial }{\partial y}, \frac{\partial }{\partial z})$와 스칼라 $f$의 곱이 아니라는 사실이다. 물론 그렇게 받아들이면 직관적이고 좋아보이지만, 사실은 반대이다. 벡터와 스칼라의 곱처럼 보이라고 $\nabla$를 $(\frac{\partial }{\partial x}, \frac{\partial }{\partial y}, \frac{\partial }{\partial z})$와 같은 벡터라고 설명하는 것이다. 만약 $\nabla f$가 벡터 $\nabla$와 스칼라 $f$의 곱이라면, 벡터와 스칼라의 곱은 교환가능하므로 다음의 이상한 수식이 성립한다.

$$ \nabla f = \left( \dfrac{\partial f}{\partial x}, \dfrac{\partial f}{\partial y}, \dfrac{\partial f}{\partial z} \right) \overset{?}{=} \left( f\dfrac{\partial }{\partial x}, f\dfrac{\partial }{\partial y}, f\dfrac{\partial }{\partial z} \right) = f\nabla $$

이런 이상한 수식이 튀어나온 것은 실제로 $\nabla$는 벡터가 아니고, $\nabla f$는 벡터와 스칼라의 곱이 아니기 때문이다. $\nabla$는 벡터가 아니라 $f(x,y,z)$라는 스칼라 함수를 $\left( \frac{\partial f(x,y,z)}{\partial x}, \frac{\partial f(x,y,z)}{\partial y}, \frac{\partial f(x,y,z)}{\partial z} \right)$라는 벡터함수로 대응시키는 연산자이다. 함수 자체를 변수로 갖는 $\operatorname{grad}$라는 함수를 다음과 같이 정의해보자.

$$ \begin{equation} \operatorname{grad} (f) = \left( \dfrac{\partial f}{\partial x}, \dfrac{\partial f}{\partial y}, \dfrac{\partial f}{\partial z} \right), \quad f=f(x,y,z) \end{equation} $$

이 정의에서 무슨 벡터와 무슨 스칼라의 곱이라는 설명은 필요하지 않다. $\operatorname{grad}$는 그저 변수로 $f$가 입력되면, $(1)$의 규칙에 따라 함숫값을 갖는 함수(연산자)일 뿐이다. 그런데 $\operatorname{grad} (f)$의 함숫값을 잘 보니 $\operatorname{grad} = \nabla$라고 표기하고 이를 $\nabla = (\frac{\partial }{\partial x}, \frac{\partial }{\partial y}, \frac{\partial }{\partial z})$라는 벡터라고 설명하면 직관적이고 편리한 표기법이 되는 것이다.

이와 비슷하게 본질적인 의미를 제대로 설명하는 것은 아니지만 계산과 이해의 편리함 때문에 쓰이는 다른 표기법으로는 미분의 라이프니츠 표기법이 있다. 미분에 대해서 $\dfrac{dy}{dx}$라는 표기법을 채택하고 분수처럼 다루면, 변화율이라는 의미를 이해하기에 편하고, 무지성으로 곱하거나 약분하는 등의 계산을 해도 실제 결과와 찰떡같이 맞아들어간다. 그렇지만 여러분들은 $\dfrac{dy}{dx}$는 분수가 아니라는 것을 알고있다. 그렇게 보일 뿐이고, 그렇게 다루면 계산하기 편리할 뿐인 것이다. $\nabla f$도 이와 마찬가지로 벡터와 스칼라의 곱으로 보일 뿐이고, 그렇게 다루면 계산이 편리한 것이지, 실제로 그렇다는 건 아니다.

그럼 $f\nabla$는 뭔데?

위의 설명에 따라서 $\nabla$는 하나의 함수이므로, $\nabla f = \nabla(f)$는 $\nabla$라는 함수에 $f$라는 변수를 대입했을 때 얻는 함숫값이다. 반면에 $f \nabla$는 이 자체로 하나의 함수이며, $g$라는 함수를 변수로 대입했을 때 아래와 같이 함숫값을 대응시키는 함수(연산자)이다.

$$ (f\nabla) (g) = f\left( \dfrac{\partial g}{\partial x}, \dfrac{\partial g}{\partial y}, \dfrac{\partial g}{\partial z} \right) = \left( f\dfrac{\partial g}{\partial x}, f\dfrac{\partial g}{\partial y}, f\dfrac{\partial g}{\partial z} \right) $$

물론 $f \nabla g$라는 함숫값을 놓고 봤을 땐, $f \nabla$에 $g$를 대입한 것이라고 봐도 되고, 스칼라함수 $f$와 벡터함수 $\nabla g$의 곱으로 봐도 된다.

유도

1차원

1.png

위 그림을 보자. $f_{1}$의 점 $x=2$에서의 미분 계수는 $4$이다. $4$라는 값은 함수 $f_{1}$이 점 $x=2$에서 어느 정도로 기울어졌는지를 말해주는 양이지만 그것 뿐만이 아니다. $4$ 앞에 $+$라는 부호가 $f_{1}$의 그래프는 $x$가 증가하는 방향으로 증가한다는 사실도 알려준다. 따라서 미분 계수 $4$를 단순히 스칼라가 아니라 1차원 벡터 $4\hat{\mathbf{x}}$로 이해해야한다.

2.png

마찬가지로 $f_{2}$의 $x=2$에서의 미분 계수는 $-3$인데 이는 기울어진 정도가 $3$이라는 것과 더불어 $x$가 증가하는 방향으로 갈 수록 $f_{2}$의 그래프가 감소한다는 의미를 포함한다. 즉 부호를 방향이라고 생각했을 때 미분 계수의 방향은 함수의 그래프가 커지는 쪽을 향한다는 얘기다. 다른 말로 하면 미분 계수가 가리키는 곳을 따라가면 그래프의 정상을 찾을 수 있다는 말이다.

3차원으로 확장하기 전에 $y$의 $x$에서의 미분 계수 $\dfrac{ d y}{ d x}=a$를 마치 분수인 것처럼 쓸 수 있음을 떠올리자. 이는 미분을 수학적으로 엄밀하게 다루는 방법은 아니나 기하학적인 의미를 이해하는데 도움을 주는 등 의 이점이 있다. 라이프니츠는 $dy$, $dx$를 $y$와 $x$의 아주 작은 변화량, 미분소라고 생각했고 그 변화량 사이의 비율을 미분계수라고 불렀다.1

$$ dy=adx $$

여담으로 이렇게 생각하면 왜 $a$를 미분 ‘계수’라 부르는지 이해할 수 있다.

3차원

이제 3차원 스칼라 함수 $f=f(x,y,z)$와 위치 벡터 $\mathbf{r}=x\hat{\mathbf{x}}+y\hat{\mathbf{y}}+z\hat{\mathbf{z}}$이 주어졌다고 하자. $f$의 변화량은 전미분으로 표현된다.

$$ \begin{equation} df=\frac{ \partial f}{ \partial x }dx + \frac{ \partial f}{ \partial y}dy+\frac{ \partial f}{ \partial z}dz \end{equation} $$

$\mathbf{r}$의 변화량은 아래와 같다.

$$ d\mathbf{r}=dx\hat{\mathbf{x}}+dy\hat{\mathbf{y}}+dz\hat{\mathbf{z}} $$

이제 1차원에서와 같이 $df$와 $d\mathbf{r}$ 사이의 비율을 나타내는 무언가를 찾아보자. 그런데 $df$는 스칼라이고 $d\mathbf{r}$은 벡터이므로 그 ‘무언가’는 벡터이며, $df$는 그 무언가와 $d\mathbf{r}$의 내적으로 표현됨을 상상할 수 있다. 따라서 일단 그 무언가를 $\mathbf{a}=a_{1}\hat{\mathbf{x}}+a_{2}\hat{\mathbf{y}}+a_{3}\hat{\mathbf{z}}$라고 표기하여 다음과 같이 나타내자.

$$ \begin{align*} df=\mathbf{a}\cdot d\mathbf{r}&=(a_{1}\hat{\mathbf{x}}+a_{2}\hat{\mathbf{y}}+a_{3}\hat{\mathbf{z}})\cdot(dx\hat{\mathbf{x}}+dy\hat{\mathbf{y}}+dz\hat{\mathbf{z}}) \\ &= a_{1}dx+a_{2}dy+a_{3}dz \end{align*} $$

이를 $(2)$와 비교하면 아래의 결과를 얻는다.

$$ \mathbf{a}=\frac{ \partial f}{ \partial x}\hat{\mathbf{x}}+\frac{ \partial f}{ \partial y}\hat{\mathbf{y}}+\frac{ \partial f}{ \partial z}\hat{\mathbf{z}} $$

이제부터 이 벡터 $\mathbf{a}$를 $\nabla f$로 표기하고 $f$의 그래디언트라고 부르기로 하자. 그래디언트의 방향은 함수 $f$의 그래프가 가장 크게 증가하는 방향을 가리키고, 크기는 그 정도를 나타낸다.

관련된 공식

  • 선형성:

    $$ \nabla (f + g) = \nabla f + \nabla g $$

  • 곱셈규칙:

    $$ \nabla{(fg)}=f\nabla{g}+g\nabla{f} $$ $$ \nabla(\mathbf{A} \cdot \mathbf{B}) = \mathbf{A} \times (\nabla \times \mathbf{B}) + \mathbf{B} \times (\nabla \times \mathbf{A})+(\mathbf{A} \cdot \nabla)\mathbf{B}+(\mathbf{B} \cdot \nabla) \mathbf{A} $$

  • 이계도함수:

    $$ \nabla \cdot (\nabla T) = \dfrac{\partial^{2} T}{\partial x^{2}} + \dfrac{\partial ^{2} T} {\partial y^{2}} + \dfrac{\partial ^{2} T}{\partial z^{2}} $$ $$ \nabla \times (\nabla T)= \mathbf{0} $$ $$\nabla (\nabla \cdot \mathbf{A} ) $$

  • 기울기의 기본 정리

    $$ T(b)-T(a) = \int _{a}^{b} (\nabla T) \cdot d\mathbf{l} $$

  • 적분 공식

    $$ \int_{\mathcal{V}} (\nabla T) d \tau = \oint_{\mathcal{S}} T d \mathbf{a} $$ $$ \int_{\mathcal{V}} \left[ T \nabla^{2} U + (\nabla T) \cdot (\nabla U) \right] d \tau = \oint_{\mathcal{S}} (T \nabla U) \cdot d \mathbf{a} $$ $$ \int_{\mathcal{V}} \left( T \nabla^{2} U - U \nabla^{2} T \right) d \tau = \oint_{\mathcal{S}} \left( T \nabla U - U \nabla T \right) \cdot d \mathbf{a} $$ $$ \int_{\mathcal{S}} \nabla T \times d \mathbf{a} = - \oint_{\mathcal{P}} T d \mathbf{l} $$

  • 부분적분

    $$ \int_{\mathcal{V}}\mathbf{A} \cdot (\nabla f)d\tau = \oint_{\mathcal{S}}f\mathbf{A} \cdot d \mathbf{a}-\int_{\mathcal{V}}f(\nabla \cdot \mathbf{A})d\tau $$ $$ \int_{\mathcal{S}} f \left( \nabla \times \mathbf{A} \right)\mathbf{A} \cdot d \mathbf{a} = \int_{\mathcal{S}} \left[ \mathbf{A} \times \left( \nabla f \right) \right] \cdot d\mathbf{a} + \oint_{\mathcal{P}} f\mathbf{A} \cdot d\mathbf{l} $$

같이보기