● 인공지능, 분석/21.08 nipa_AI실무과정
[AI 응용 ML] 이론 | 2.5 수치형 자료 전처리
0ver-grow
2021. 8. 31. 14:36
반응형
수치형 자료란?
스케일링의 정규화
좌측, 변환 전에서 feature_3의 범주는 1 ~ 200까지이나
우측, 정규화 변환 후 0.1 ~ 0.5까지의 범주를 지님
이를 통해, 머신러닝안에서 공정하게 비교가 가능해짐
스케일링의 표준화
앞서 정규화에선 feature_3의 값이 0~1의 값을 지녔다면
표준화에선 -2 ~ 2의 값을 지님
표준화란,
평균이 0, 표준편차가 1이므로
-2 ~ 2사이의 값을 지니는 분포로 바뀜.
표준화를 통해 머신러닝상에서 공정한 경쟁이 이뤄지게함
범주화란?
변수의 값보다 범주가 중요한 경우 사용
시험 점수 예측이 아닌 점수가 평균 이상인지 이하인지를 찾을 때
이상, 이하에 대한 범주를 구하고자할 때 사용.
반응형