基礎統計学における中央値の定義
定義 1
個の量的データが大きさ順に与えられたとき、全データの中央に位置する値を中央値またはメディアンmedian という。が奇数ならを用い、が偶数なら次を満たすすべてのが中央値である。
ここで、は天井関数だ。
説明
中央値はデータの中心を示す尺度measure of Centerとして、平均値と比較して外れ値outlierに対して敏感ではない特性があり、唯一性が保証されない。定義で言及したように、標本の数が偶数の場合は無限に多くの中央値が存在するが、数学的な概念で無限に多いだけで、実際には以下のように単一で定める。
例えば、与えられたデータが の場合、標本の数が奇数なので真ん中に位置するが中央値であり、 の場合は全てが中央値だが、厳密にはとして扱う。ここで、のような大きな外れ値のせいで平均はに跳ね上がるが、中央値はその影響を受けないことが確認できる。
関連項目
- 統計学の三つの代表値: 最頻値、中央値、平均値
- 代表値の数理的性質: 中央値は偏差の和を最小化する性質を持っている。
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p55. ↩︎