混同行列と感度、特異度
定義
分類の問題でポジティブpositiveとネガティブnegativeを区別するモデルがあると仮定しよう。ポジティブをポジティブと判断した数をトゥルーポジティブtrue Positive、ネガティブをネガティブと判断した数をトゥルーネガティブtrue Negative、ポジティブをネガティブと間違えて判断した数をフォルスネガティブfalse Negative、ネガティブをポジティブと間違えて判断した数をフォルスポジティブfalse Positiveとしよう。
エラーマトリックス
分類の問題で、上記のような エラーマトリックスconfusion matrixをモデルを評価する指標として参照できる。
正解率
上の表で、Pはポジティブ、Nはネガティブを表す。TPはポジティブと予測され実際にポジティブである場合、TNはネガティブと予測され実際にネガティブである場合だ。このTPとTNが比較的高いモデルを良いモデルと評価することは常識であり、妥当である。一方で、「正」があれば当然「誤」もある。誤分類率error rateは下記のように定義される。
精度
精度は真と予済まれるものの中で実際に真である物の割合だ。Accuracyと混同しないようにしよう。
感度
感度はポジティブなものの中で真と予測されたものの割合で、再現率recallまたは真陽性率とも呼ばれる。
特異度
特異度はネガティブなものの中で偽と予測されたものの割合だ。
ここで、偽陽性率と真陽性率を軸として描かれる図をROC曲線という。
参照
- エラーマトリックスと感度、特異度
- スコア
- データ科学で正解率が過大評価される状況
- 精度precision
- 再現率recall