logo

データの正規化 📂データサイエンス

データの正規化

用語

正規化

与えられたデータを$0$から$1$の間の値に変換することを正規化normalizationと言う。普通、データの最大値$x_{\text{max}}$と最小値$x_{\text{min}}$に関して、次のような変換$T$を通じて得る。 $$ T (x) = {{ x - x_{\text{min}}} \over { x_{\text{max}} - x_{\text{min}}}} $$ たまに、単にスケーリングscalingと呼ばれることもある。

説明

線形代数で、ベクトルを正規直交化したという意味で単に正規化されたベクトルnormalized Vectorという表現を使うことがあるので、注意が必要である。

正則化regularizationは、言葉自体と使用される文脈が似ているが、データ自体をいじるのではなく、学習でのロスに関わる技術であり、全く異なる。

参照