지도학습과 비지도학습 📂머신러닝

지도학습과 비지도학습

정의

머신러닝에서 종속변수가 정해진 경우를 지도학습, 그렇지 않은 경우를 비지도학습이라고 한다.

예시

$20190401\_111249.png$

지도학습과 비지도학습의 차이는 쉽게 비유하자면 객관식과 주관식의 차이다. 예를 들어 위와 같이 6개의 타일을 주고 색을 답하는 분류문제가 있다고 해보자.

지도학습

$20190401\_111825.png$

그런데 여기서 녹색이냐 적색이냐의 두 가지 선택지만 있다면 솔직히 반반도 있고 아예 노란색인 것도 있지만 그나마 둘 중 더 가깝다고 생각하는 쪽을 선택하게 될 것이다. 조금 다르게 생각하면 정답이 ‘녹색’ 아니면 ‘적색’이라는 정보를 준 것이라고 볼 수 있다. 이러한 센스에서 지도학습이라는 표현은 타당하다. 이를 조금 더 일반적으로 표현하면 ‘종속변수가 주어졌다’고 한다.

지도학습은 회귀^regression와 분류^classifying에 관심이 있을 때 사용한다.

비지도 학습

$20190401\_112136.png$

반면에 아무런 제한 없이 구분을 해보라고 하면 ‘적-녹 그라데이션’이나 ‘노란색’은 녹색, 적색과 확실히 구분되는 이질적인 무언가다. 그리고 그 또한 적절한 대답이긴 하다. 이렇듯 학습을 하긴 하지만 별다른 제한 없이 답이 나온다는 점에서 비지도학습이라는 표현은 타당하다. 이 때 기계는 답이 녹색이냐 적색이냐 하는 의미에는 매달리지 않는다. 대답에 의미를 부여하는 것은 인간의 몫이다.

비지도학습은 군집화^clustering에 관심이 있을 때 사용한다.

강화학습

지도학습과 비지도학습의 공통점이라고 한다면 객관식이든 주관식이든 답이 있는 문제를 풀기 위한 방법이라는 점이다. 쉽게 말해 묻는 말에 대답하는 것인데, 이와 달리 강화학습^{reinforcement Learning}은 ‘잘 하게 되는 것’에 초점을 둔다. ‘뭘 잘하라는거지?’, ‘너무 막연하고 애매하지 않나?‘와 같은 의문은 타당하다. 하지만 반대로 말해서 ‘뭔가 잘해야하는데 그게 뭔지 막연하고 애매한 상황’이면 강화학습과 같은 접근법이 필요해짐을 느낄 수 있을 것이다.