logo

多変量データの散布図 📂データサイエンス

多変量データの散布図

定義 1

多変量データが与えられたとしよう。量的データを2つ選んで、1つは水平軸(x軸)、もう1つは垂直軸(y軸)として、点をプロットした図を散布図scatter Plotという。

説明

以下は、ガールズグループ「宇宙少女」のメンバーの生年と身長を記録した多変量データである。通常、2つの変数の間に相関関係があるかどうかを確認するために散布図を描いてみることがある。

20220614_132752.png

データサイエンスで散布図の重要性は、どんなデータでもその正式な分析に先立って探索的データ分析exploratory Data Analysisが伴わなければならず、その時に欠かせないものが散布図であることにある。

参照


  1. Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p102. ↩︎