logo

定性データの頻度 📂データサイエンス

定性データの頻度

定義

  1. 質的データの各観測値が現れる頻度を頻度という。
  2. 頻度を全データの数で割ったものを相対頻度とし、相対頻度に100を掛けた値をパーセンテージという。
  3. 複数のカテゴリーに各頻度または相対頻度がどのように分布しているかを表すことを頻度分布という。

説明

Frequencyは、物理学の文脈では一般的に周波数と訳されるが、統計学の文脈ではそのデータがどれだけ頻繁に見つかるかを示す数値としての意味を持つ。ただし、学術的な用語でない「頻度」という言葉は混乱を与えることがあるため、漢字の頻を外して単に頻度と呼ぶと考えれば良い。

言葉は少し難しそうに書いてあるけど、実際には「何回」かを意味する。非常に簡単な例として、コインを50回投げて、表が40回、裏が10回出た場合、それぞれの頻度は40、10となり、相対頻度は0.8、0.2となる。常識的に考えて、この例ではコインの表が異常に多く出たと思われるだろう。私たちの自然な関心事は、このコインが本当に公平かどうかであり、頻度分布を把握することで、統計的な推論を進めることになる。

参照