多変量データの散布図
定義 1
多変量データが与えられたとしよう。量的データを2つ選んで、1つは水平軸(x軸)、もう1つは垂直軸(y軸)として、点をプロットした図を散布図scatter Plotという。
説明
以下は、ガールズグループ「宇宙少女」のメンバーの生年と身長を記録した多変量データである。通常、2つの変数の間に相関関係があるかどうかを確認するために散布図を描いてみることがある。
データサイエンスで散布図の重要性は、どんなデータでもその正式な分析に先立って探索的データ分析exploratory Data Analysisが伴わなければならず、その時に欠かせないものが散布図であることにある。
参照
- Rで散布図を描く:統計分析に特化したプログラミング言語Rでは、図を描く関数
plot()
が基本的に散布図を描く。
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p102. ↩︎