머신러닝

기계학습machine learning이란, 기계이미 가지고 있는 데이터 집합에서 특징feature을 파악하여 새로운 데이터에 그 특징을 적용할 수 있도록 하는 것을 말한다.

위 정의는 딱히 엄밀한 정의도 아니고, 정의가 엄밀해야할 필요도 없다. 이미 가지고 있는 데이터를 분석해서 얻은 결과를 새로운 데이터에 적용시킬 수 있도록 한다는 점만 알면 된다. 기계는 간단히 말해서 컴퓨터, 즉 프로그래밍 코드라고 이해하면 된다. 이미 가지고 있는, 그러니까 학습에 쓰이는 데이터 집합을 트레이닝 셋training set, 훈련집합이라고 한다. 기계학습을 시험공부하는 학생에 비유하면 다음과 같다.

2021년 현재, 기계학습을 구현하는데 가장 많이 쓰이는 방법은 인공신경망의 은닉층을 늘리는 딥러닝deep learning, 심층학습이다. 인공신경망은 최근에 들어서 비약적으로 성능이 높아졌으며, 가장 좋은 성능을 뽐내기도 한다. 딥러닝이 만족할만한 성능을 보여주기 전까지 기계학습의 주류였던 것은 통계적 이론을 바탕으로한 모델들이었다.

머신러닝을 할 줄 아는 사람이 되려면 수학, 통계학, 컴퓨터 공학을 할 줄 알아야한다. 이론을 이해하기 위해서 수학, 통계학 지식이 요구되고, 이를 구현하기 위해서는 코딩을 할 줄 알아야하기 때문이다. 특히나 머신러닝 이론에 대해서 깊게 공부하려면 행렬에 대한 선형대수학 지식 뿐만 아니라 측도론, 함수해석학 등이 필요하다. 또한 최근에는 기하학, 그래프이론, 미분방정식 등과 인공지능을 연계한 연구도 진행되고 있다.1

기초

검증

고전 기계학습

선형회귀모델

선형 분류 모델

클러스터링

강화학습

딥러닝

이론

파이토치

오류

주요 참고문헌


  1. https://horizon.kias.re.kr/15780/ ↩︎

전체 포스트
댓글