logo

데이터의 정규화 📂데이터과학

데이터의 정규화

용어

정규화

주어진 데이터를 $0$ 부터 $1$ 사이의 값으로 변환하는 것을 정규화normalization라 한다. 흔히 데이터의 최대값 $x_{\text{max}}$ 과 최소값 $x_{\text{min}}$ 에 대해 다음과 같은 변환 $T$ 을 통해 얻는다. $$ T (x) = {{ x - x_{\text{min}}} \over { x_{\text{max}} - x_{\text{min}}}} $$ 가끔은 그냥 스케일링scaling이라고 부를 수도 있다.

설명

정규화는 선형대수에서 벡터를 정규직교화했다는 의미에서 그냥 정규화된 벡터normalized Vector라는 표현을 쓰기도 한다는 점에 주의해야 한다.

정칙화regluarization는 단어 자체와 사용되는 맥락도 비슷하지만, 데이터 자체를 건드리는 것이 아닌 학습에서의 로스에 관혀하는 기법으로 전혀 다르다.

같이보기