データサイエンス
データサイエンスData Scienceは形式科学の一分野として、データを収集し、加工し、保存し、分析し、表現する技術の総体を指します。このカテゴリでは、学部1~2年生の基礎統計学とビジュアライゼーションについて扱います。
統計学入門
- 統計学の定義
- 母数と統計量
- 🔒(24/07/05) 超母数、ハイパーパラメータとは?
- 統計学での自由度とは?
データ
中心性と散布度
評価
- 🔒(24/03/19) 分類問題と回帰問題の定義
- クロスバリデーション
- 適合度、予測値、残差、誤差
分類問題
- 誤分類行列と感度、特異度
- 🔒(24/03/25) 正確度が過大評価される状況
- ROC曲線
- 🔒(24/04/06) $F_{1}$スコア
ビジュアライゼーション
エクセル
主要参考文献
- Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition)
- 경북대학교 통계학과. (2008). 엑셀을 이용한 통계학
全體ポスト
- ヒートマップとは?
- デンドログラムとは?
- データの定義と語源
- 質的変数と連続変数
- 統計学における尺度:名義、順序、区間、比率
- 統計学の定義
- 定性データの頻度
- 量的データの階級
- 質的データの棒グラフ
- 量的データのヒストグラム
- 時系列データの折れ線グラフ
- 多変量データの散布図
- 基礎統計学における平均の定義
- 基礎統計学における母数と統計量
- 基礎統計学における中央値の定義
- 基礎統計学における最頻値の定義
- 基礎統計学における分散の定義
- Zスコアと標準化
- パーセンタイルと外れ値
- 統計学における自由度
- 箱ひげ図とは何か?
- データサイエンスにおける次元削減
- データサイエンスにおける独立変数と従属変数
- データサイエンスにおける分類問題と回帰問題の定義
- データサイエンスにおける精度の過大評価
- データサイエンスにおける精度とは?
- データサイエンスにおける再現性とは?
- データサイエンスにおけるF1スコアとは?
- ハイパーパラメータとは?