데이터과학에서 분류문제와 회귀문제의 정의
용어
데이터과학에서는 문제의 종속변수가 무엇인지에 따라서 다음과 같이 구분하기도 한다.
분류 문제
종속변수가 질적변수인 문제를 분류classification 문제라 한다. 특히 질적변수의 계급이 두 개 뿐일 때, 이를 이진분류binary Classification라 한다.
회귀 문제
분류문제와 대비되는 표현으로써 종속변수가 양적변수면 회귀regression 문제라 하며, 이는 회귀분석에서 유래했다. 특히 종속변수가 독립변수들의 선형결합으로 나타날 때, 이를 선형회귀linear regression라 한다.