지도학습과 비지도학습
정의
머신러닝에서 종속변수가 정해진 경우를 지도학습, 그렇지 않은 경우를 비지도학습이라고 한다.
예시
지도학습과 비지도학습의 차이는 쉽게 비유하자면 객관식과 주관식의 차이다. 예를 들어 위와 같이 6개의 타일을 주고 색을 답하는 분류문제가 있다고 해보자.
지도학습
그런데 여기서 녹색이냐 적색이냐의 두 가지 선택지만 있다면 솔직히 반반도 있고 아예 노란색인 것도 있지만 그나마 둘 중 더 가깝다고 생각하는 쪽을 선택하게 될 것이다. 조금 다르게 생각하면 정답이 ‘녹색’ 아니면 ‘적색’이라는 정보를 준 것이라고 볼 수 있다. 이러한 센스에서 지도학습이라는 표현은 타당하다. 이를 조금 더 일반적으로 표현하면 ‘종속변수가 주어졌다’고 한다.
지도학습은 회귀regression와 분류classifying에 관심이 있을 때 사용한다.
비지도 학습
반면에 아무런 제한 없이 구분을 해보라고 하면 ‘적-녹 그라데이션’이나 ‘노란색’은 녹색, 적색과 확실히 구분되는 이질적인 무언가다. 그리고 그 또한 적절한 대답이긴 하다. 이렇듯 학습을 하긴 하지만 별다른 제한 없이 답이 나온다는 점에서 비지도학습이라는 표현은 타당하다. 이 때 기계는 답이 녹색이냐 적색이냐 하는 의미에는 매달리지 않는다. 대답에 의미를 부여하는 것은 인간의 몫이다.
비지도학습은 군집화clustering에 관심이 있을 때 사용한다.
강화학습
지도학습과 비지도학습의 공통점이라고 한다면 객관식이든 주관식이든 답이 있는 문제를 풀기 위한 방법이라는 점이다. 쉽게 말해 묻는 말에 대답하는 것인데, 이와 달리 강화학습reinforcement Learning은 ‘잘 하게 되는 것’에 초점을 둔다. ‘뭘 잘하라는거지?’, ‘너무 막연하고 애매하지 않나?‘와 같은 의문은 타당하다. 하지만 반대로 말해서 ‘뭔가 잘해야하는데 그게 뭔지 막연하고 애매한 상황’이면 강화학습과 같은 접근법이 필요해짐을 느낄 수 있을 것이다.