본문 바로가기
● 인공지능, 분석/21.08 nipa_AI실무과정

[AI 응용 ML] 이론 | 2.5 수치형 자료 전처리

by 0ver-grow 2021. 8. 31.
반응형

수치형 자료란?

스케일링의 정규화

좌측, 변환 전에서 feature_3의 범주는 1 ~ 200까지이나

우측, 정규화 변환 후 0.1 ~ 0.5까지의 범주를 지님

이를 통해, 머신러닝안에서 공정하게 비교가 가능해짐

 

스케일링의 표준화

앞서 정규화에선 feature_3의 값이 0~1의 값을 지녔다면

표준화에선 -2 ~ 2의 값을 지님

 

표준화란,

평균이 0, 표준편차가 1이므로

-2 ~ 2사이의 값을 지니는 분포로 바뀜.

표준화를 통해 머신러닝상에서 공정한 경쟁이 이뤄지게함

 

범주화란?

변수의 값보다 범주가 중요한 경우 사용

시험 점수 예측이 아닌 점수가 평균 이상인지 이하인지를 찾을 때

이상, 이하에 대한 범주를 구하고자할 때 사용.

 

 

반응형