본문 바로가기
● 인공지능, 분석/20.08 생코_머신러닝

생활코딩_머신러신개념_분류_지도학습_회귀/분류

by 0ver-grow 2020. 8. 18.
반응형

머신러닝은 단일 기술이 아니다.

머신러닝이라는 이름 아래 각자의 목표를 지닌 다양한 도구들이 있다.

 

지도학습

지도학습의 ‘지도'는 기계를 가르친다(supervised)는 의미입니다.

마치 문제집을 푸는 것과 비슷합니다.

이후에 비슷한 문제를 만나면 오답에 빠질 확률은 점점 낮아집니다.

앞서 살펴본 손톱 감시 앱과 레모네이드 판매량 예측 작업은 지도학습을 이용한 것입니다.

 

비지도학습

비지도학습은 지도학습에 포함되지 않는 방법들입니다.

기계에게 데이터에 대한 통찰력을 부여하는 것이라고 이야기할 수 있을 것 같습니다.

누가 정답을 알려주지 않았는데도 무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것이라고 할 수 있습니다.

데이터의 성격을 파악하거나 데이터를 잘 정리정돈 하는 것에 주로 사용됩니다.

 

강화학습

강화학습은 학습을 통해서 능력을 향상시킨다는 점에서는 지도학습이랑 비슷합니다.

차이점은 지도학습이 정답을 알려주는 문제집이 있는 것이라면,
강화학습은 어떻게 하는 것이 더 좋은 결과를 낼 수 있는지를 스스로 실력 향상을 위해서 노력하는 수련과 비슷합니다.

경험을 통해 “더 좋은 답”을 찾아가는 것입니다.

 

게임에는 룰이 있고, 룰에 따라 어떤 행동을 하면, 그 결과에 따라서 상이나 벌을 받습니다.
더 큰 상을 받기 위한 과정을 끝없이 반복하다 보면 그 게임의 고수가 됩니다.
이런 과정을 기계에게 시켜서 기계 스스로가 고수로 성장하도록 고안된 방법이 강화학습이라고 할 수 있습니다.


지도학습은 역사와 비슷합니다.

역사는 원인과 결과로 기록되어 있다.

어떤 사건이 일어났을 때, 어떤 일이 일어날지를 예측할 수 있다.

지도학습은 과거의 데이터로부터 학습해서 결과를 예측하는 데에 주로 사용됩니다.

과거에 대한 학습을 통해서
미지의 데이터를 추측하고 싶은 것이죠.
이때 머신러닝의 지도학습이 이용될 수 있습니다.

 

지도학습을 이용하기 위해서는
우선 충분히 많은 데이터를 수집해야 합니다.
데이터는 독립변수와 종속변수로 이루어져 있어야 합니다.

 

지도학습으로 훈련시키면 컴퓨터는 모델을 만듭니다.

온도 X 2 = 판매량

 

모델이 만들어지면, 모델을 사용하면 됩니다.
이 모델에 온도를 입력하면 판매량을 예측 할 수 있습니다.

2000만 명이 사용하는 온라인 쇼핑몰의 대표이사입니다.
이런 상황에서 수요를 예측하는 것이 얼마나 중요하고,
어려운 일일까요?

이것을 사람이 계산으로
예측한다는 것은 불가능한 일입니다.

바로 이런 문제를 머신러닝의 지도학습이
해결해줄 수 있습니다.

 

독립변수, 종속변수, 모델

독립변수와 종속변수의 관계를 컴퓨터에게 학습시키면
컴퓨터는 그 관계를 설명할 수 있는 공식을 만들어냅니다.

이 공식을 머신러닝에서는 ‘모델’이라고 합니다.
좋은 모델이 되려면 데이터가 많을수록, 정확할수록 좋습니다.

 

모델을 만들면 아직 결과를 모르는 원인을
모델에 입력했을 때 결과를 순식간에 계산해서 알려줍니다.


회귀 VS 분류

지도학습은 크게 ‘회귀’와 ‘분류’

회귀는 영어로 Regression이고, 분류는 Classification

예측하고 싶은 종속변수가 숫자일 때
보통 회귀라는 머신러닝의 방법을 사용합니다.

숫자를 예측하고 싶다면 무엇을 써야 한다고요?


어떤 문제를 만났는데
그 문제에서 추측하고 싶은 결과가
이름 혹은 문자라면 이렇게 하면 됩니다.

 

 


양적 데이터와 범주형 데이터

얼마나 큰지, 얼마나 많은지,
어느 정도인지를 의미하는 데이터라는 뜻에서
‘양적(量的, Quantitative)'이라고 합니다.

 

누가 여러분에게 양적 데이터라고 말했다면
숫자라고 알아들으면 됩니다.

 

또 산업에서는 ‘이름'이라는 표현 대신에
‘범주(範疇, Categorical)'라는 말을 씁니다.

 

종속변수가 양적 데이터라면?

회귀를 사용하면 됩니다.

종속변수가 범주형 데이터라면?

분류를 사용하면 됩니다.

 

 

 

 

반응형