앞으로 이어질 포스팅에서는 머신러닝의 거장 Andrew NG 스탠포드 교수가 Coursera라는 MOOC 플랫폼에서 진행하는 Machine Learning 강의를 기반으로 머신러닝에 대한 개략적인 내용을 서술하고자 한다. 총 11주 과정으로 구성되어 있지만 포스팅의 구성은 내가 중요하다고 생각하거나 관련있다고 생각하는 기준에 따라서 적절히 수정해서 구성할 것이다.


머신러닝이란?

  • 컴퓨터가 프로그래밍 없이도 스스로 학습할 수 있는 능력을 가질 수 있도록 하는 연구
  • 태스크(T)에 있어서 능률(P)을 경험(E)을 통해 향상시키고자 하는 연구
  • E(Experience) + T(Task) + P(Probability)
  • 머신러닝은 크게 두가지, 지도학습과 비지도학습으로 분류된다

지도학습(Supervised Learning)

지도학습

주어진 데이터셋에 예측하고자 하는 정답이 명시적으로 포함된 경우를 말한다. 예를 들면 종양의 크기를 통해 유방암의 유무를 예측하고자 하는 경우, 집의 크기를 통해 집값을 예측하고자 하는 경우가 지도학습에 해당된다.

지도학습도 두 가지로 분류될 수 있는데, 회귀(Regression)과 분류(Classification)으로 나누어진다. 이에 대해서는 이어질 포스팅에서 서술한다.


비지도학습(Unsupervised Learning)

비지도학습

비지도학습에서는 데이터셋에 우리가 예측해야 할 정답이 명시적으로 포함되어 있지 않다. 학습을 통해 데이터셋에서 어떠한 구조를 찾아내는 것이 비지도학습의 궁극적 목표이다.

+ Recent posts