반응형
수치형 자료란?
스케일링의 정규화
좌측, 변환 전에서 feature_3의 범주는 1 ~ 200까지이나
우측, 정규화 변환 후 0.1 ~ 0.5까지의 범주를 지님
이를 통해, 머신러닝안에서 공정하게 비교가 가능해짐
스케일링의 표준화
앞서 정규화에선 feature_3의 값이 0~1의 값을 지녔다면
표준화에선 -2 ~ 2의 값을 지님
표준화란,
평균이 0, 표준편차가 1이므로
-2 ~ 2사이의 값을 지니는 분포로 바뀜.
표준화를 통해 머신러닝상에서 공정한 경쟁이 이뤄지게함
범주화란?
변수의 값보다 범주가 중요한 경우 사용
시험 점수 예측이 아닌 점수가 평균 이상인지 이하인지를 찾을 때
이상, 이하에 대한 범주를 구하고자할 때 사용.
반응형
'● 인공지능, 분석 > 21.08 nipa_AI실무과정' 카테고리의 다른 글
[AI 응용 ML] 이론 | 2.7 데이터 정제 및 분리 (0) | 2021.08.31 |
---|---|
[AI 응용 ML] 실습 | 2.6 수치형 자료 변환하기_정규화 / 표준화 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 2.4 명목형 자료 변환_더미방식 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 2.3 명목형 자료 변환_수치맵핑 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.2 범주형 자료 전처리 (0) | 2021.08.31 |