logo

딥러닝에서 레이어란? 📂머신러닝

딥러닝에서 레이어란?

정의

딥러닝에서, 선형변환 Lmn:RnRmL^{mn} : \mathbb{R}^{n} \to \mathbb{R}^{m}레이어layer, 층라 한다.

일반화

딥러닝에서, 고정된 bRm\mathbf{b} \in \mathbb{R}^{m}에 대해 아핀변환 xLmn(x)+b\mathbf{x} \mapsto L^{mn}(\mathbf{x}) + \mathbf{b}를 레이어라 한다.

설명

다시 말하자면 레이어라는 것은 선형벡터함수를 의미한다. 반면 비선형스칼라 함수활성화 함수라 부른다.

이를 층이라 부르는 이유는 여러번 합성한 것을 시각화했을 때 층을 겹겹이 쌓아올린 것 같이 보이기 때문이다.

Lnmnm1Ln2n1:[x1xn1][y1yn2][z1zn3][v1vnm1][w1wnm] L^{n_{m}n_{m-1}} \circ \cdots \circ L^{n_{2}n_{1}} : \begin{bmatrix} x_{1} \\ \vdots \\ x_{n_{1}}\end{bmatrix} \mapsto \begin{bmatrix} y_{1} \\ \vdots \\ \vdots \\ y_{n_{2}}\end{bmatrix} \mapsto \begin{bmatrix} z_{1} \\ \vdots \\ \vdots \\ \vdots \\ z_{n_{3}}\end{bmatrix} \mapsto \cdots \mapsto \begin{bmatrix} v_{1} \\ \vdots \\ \vdots \\ v_{n_{m-1}}\end{bmatrix} \mapsto \begin{bmatrix} w_{1} \\ \vdots \\ w_{n_{m}}\end{bmatrix}

레이어와 활성화 함수를 합성한 것을 인공 신경망이라 한다. 특히나 선형 함수와 계단함수를 합성한 것을 (단층) 퍼셉트론이라 부른다. 레이어와 활성화 함수를 "많이" 합성한 것을 심층 신경망deep neural network이라 하고, 심층 신경망을 이용해 함수를 근사하는 것을 딥러닝deep learning, 심층학습이라 한다.

종류

  • 선형층
  • 합성곱층
  • 풀링층