Zスコアと標準化
定義 1
説明
-スコアは、多くの場合、データの相対位置を見るために使用される指標で、実際のデータの数値とは関係なく、分布自体に注目する場合に便利だ。それを実現するために、各データから平均を引き、標準偏差で割るプロセスを標準化というが、データ科学で使われる正規化や正則化と混同しないよう注意が必要だ。標準化という表現は、z-スコアの数理統計学的な性質から来ていると考えても良くて、たとえば母集団がで最も有名な正規分布に従う場合、 なので、z-スコアは標準正規分布に従うことになる。このように、平均を、分散をに合わせるという意味で、実際のデータの具体的な数値は無意味となり、分布にのみ焦点を当てることができるようになる。
参照
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p75. ↩︎