数理統計学におけるランダムサンプリング
定義 1
- 確率変数 $X$の実際に引き出された結果を実現realizationと言い、普通、小文字の$x$で表す。
- 確率変数$X$と同じ確率分布からサンプルサイズsample Size$n$分の確率変数をサンプルsampleと呼び、次のように表す。 $$ X_{1} , X_{2} , \cdots , X_{n} $$
- 確率変数$X_{1} , \cdots , X_{n}$がiidであれば、サイズ$n$のランダムサンプルと呼ぶ。
説明
これらの定義により、数理統計学は実際の統計解析との接点を持つことになる。ランダムサンプルの実現を扱うことは、統計解析に該当し、数理統計学はそのデータをどのように扱うかについての大きな灯台となる。関心を持つデータ、得たい結論、利用する方法は異なるかもしれないが、その下には数理統計学が理論的な基盤として支えていなければならない。
実際には、数理統計学の教科書を離れると、実現という表現はあまり使われず、通常はその実現を直接言及する言葉がある。たとえばランダムサンプルの実現は、値、データ、観測値などと呼ばれる。しかし、確率変数は大文字、データは小文字という慣習は、ほとんどすべての統計学教科書で守られている。
参照
統計入門におけるデータの定義
学部1〜2年生向けの統計学入門では、実験単位や試行などで実際に測定された結果の集まりをデータと定義している。
Hogg et al. (2013).《数理統計学入門》(第7版): p208. ↩︎