평균절대비오차 MAPE
정의 1
회귀문제에서, 데이터 포인트 과 그 예측치 에 대해 평균절대비오차MAPE(Mean Absolute Precentage Error)를 다음과 같이 정의한다.
설명
장점
MAPE는 쉽고 간단한 계산법과 더불어 예측치가 얼마나 데이터를 잘 설명하는지를 백분률로 설명할 수 있기 때문에 매우 직관적인 해석을 제공한다는 장점이 있다. 중회귀계수 와 마찬가지로 데이터의 스케일과 관계 없이 절대적으로 평가할 수 있는 지표다.
예를 들어 어떤 모델의 MSE가 라고 하면 이것만 봐서는 이 모델의 성능을 짐작할 수 없다. 데이터의 스케일이 정도라면 대단히 정확하겠지만, 데이터의 스케일이 정도라면 이 모델이 데이터를 전혀 설명하지 못하는 것이다. 그러나 MAPE는 그와 관계 없이 85%, 99% 같이 누구나 이해할 수 있는 백분률로 성능을 말한다.
단점
만약 이 존재하면 MAPE는 무한대로 발산한다. 이는 수식적인 원죄에 기인하는데, 얼마나 맞고 틀리고를 떠나 수치적인 결함의 가능성을 갖고 있다는 것은 평가 지표로써 너무나 큰 약점이 된다.
당연하지만 실전에서는 만 피한다고 능사가 아니다. 꼭 이 아니라도 에 가까운 값, 보통 생각하기로는 보다 작은 값들이 있다면 충분히 문제를 일으킬 수 있는 것으로 본다.
자주 언급되지는 않지만 실제로 겪어본 MAPE의 또 다른 단점은 사실 MAPE가 에 바운드 되어 있지 않다는 것으로, 얼토당토 않은 예측치가 들어 왔을 때 아예 절대비오차가 을 넘길 가능성이 있다:
- 부호가 반대인 경우: 참값 에 대해 예측치가 이면 그 APE는 다음과 같이 가 된다.
- 너무 심하게 틀리는 경우: 참값 에 대해 예측치가 이면 그 APE는 다음과 같이 가 된다.
같이보기
Kim, S., & Kim, H. (2016). A new metric of absolute percentage error for intermittent demand forecasts. International Journal of Forecasting, 32(3), 669-679. https://doi.org/10.1016/j.ijforecast.2015.12.003 ↩︎