logo

データの正規化 📂データサイエンス

データの正規化

用語

正規化

与えられたデータを00から11の間の値に変換することを正規化normalizationと言う。普通、データの最大値xmaxx_{\text{max}}と最小値xminx_{\text{min}}に関して、次のような変換TTを通じて得る。 T(x)=xxminxmaxxmin T (x) = {{ x - x_{\text{min}}} \over { x_{\text{max}} - x_{\text{min}}}} たまに、単にスケーリングscalingと呼ばれることもある。

説明

線形代数で、ベクトルを正規直交化したという意味で単に正規化されたベクトルnormalized Vectorという表現を使うことがあるので、注意が必要である。

正則化regularizationは、言葉自体と使用される文脈が似ているが、データ自体をいじるのではなく、学習でのロスに関わる技術であり、全く異なる。

参照