logo

평균절대비오차 MAPE 📂데이터과학

평균절대비오차 MAPE

정의 1

회귀문제에서, 데이터 포인트 {xk}k=1n\left\{ x_{k} \right\}_{k=1}^{n} 과 그 예측치 {x^k}k=1n\left\{ \widehat{x}_{k} \right\}_{k=1}^{n} 에 대해 평균절대비오차MAPE(Mean Absolute Precentage Error)를 다음과 같이 정의한다. MAPE=1nk=1nxkx^kxk \text{MAPE} = {{ 1 } \over { n }} \sum_{k=1}^{n} \left| {{ x_{k} - \widehat{x}_{k} } \over { x_{k} }} \right|

설명

장점

MAPE는 쉽고 간단한 계산법과 더불어 예측치가 얼마나 데이터를 잘 설명하는지를 백분률로 설명할 수 있기 때문에 매우 직관적인 해석을 제공한다는 장점이 있다. 중회귀계수 R2R^{2} 와 마찬가지로 데이터의 스케일과 관계 없이 절대적으로 평가할 수 있는 지표다.

예를 들어 어떤 모델의 MSE10210^{-2} 라고 하면 이것만 봐서는 이 모델의 성능을 짐작할 수 없다. 데이터의 스케일이 10310^{3} 정도라면 대단히 정확하겠지만, 데이터의 스케일이 10610^{-6} 정도라면 이 모델이 데이터를 전혀 설명하지 못하는 것이다. 그러나 MAPE는 그와 관계 없이 85%, 99% 같이 누구나 이해할 수 있는 백분률로 성능을 말한다.

단점

만약 xk=0x_{k} = 0 이 존재하면 MAPE는 무한대로 발산한다. 이는 수식적인 원죄에 기인하는데, 얼마나 맞고 틀리고를 떠나 수치적인 결함의 가능성을 갖고 있다는 것은 평가 지표로써 너무나 큰 약점이 된다.

당연하지만 실전에서는 xk=0x_{k} = 0 만 피한다고 능사가 아니다. 꼭 00 이 아니라도 00 에 가까운 값, 보통 생각하기로는 11 보다 작은 값들이 있다면 충분히 문제를 일으킬 수 있는 것으로 본다.

자주 언급되지는 않지만 실제로 겪어본 MAPE의 또 다른 단점은 사실 MAPE가 [0,1][0,1]바운드 되어 있지 않다는 것으로, 얼토당토 않은 예측치가 들어 왔을 때 아예 절대비오차가 11 을 넘길 가능성이 있다:

  • 부호가 반대인 경우: 참값 55 에 대해 예측치가 5-5 이면 그 APE는 다음과 같이 2>12 > 1 가 된다. APE=5(5)5=2 \text{APE} = \left| {\frac{ 5 - (-5) }{ 5 }} \right| = 2
  • 너무 심하게 틀리는 경우: 참값 1010 에 대해 예측치가 100100 이면 그 APE는 다음과 같이 9>19 > 1 가 된다. APE=1010010=9 \text{APE} = \left| {\frac{ 10 - 100 }{ 10 }} \right| = 9

같이보기


  1. Kim, S., & Kim, H. (2016). A new metric of absolute percentage error for intermittent demand forecasts. International Journal of Forecasting, 32(3), 669-679. https://doi.org/10.1016/j.ijforecast.2015.12.003 ↩︎