본문 바로가기
● 인공지능, 분석/21.08 nipa_AI실무과정

[AI 응용 ML] 이론 | 2.2 범주형 자료 전처리

by 0ver-grow 2021. 8. 31.
반응형

명목형 자료 / 순서형 자료

명목형 : 의미 없는 범주 크기 (각 범주는 상징성)

순서형 : 의미 있는 범주 크기 (각 범주는 수치성)

1은 생존, 0은 사망처럼 숫자를 범주로 활용

명목형 자료_수치맵핑변환

1. 범주를 0 또는 1로 맵핑

2. 범주를 0, 1, 2로 변환

명목형 자료_더미 기법

0은 No, 1은 Yes를 의미한다.

변수를 추가하여 0, 1로 맵핑.

 

수치맵핑은 칼럼 하나에 범주를 작성했다면

더미기법은 범주의 갯수 만큼의 칼럼을 생성해서 모두 작성함

순서형 자료_수치맵핑

주관적인 것을 수치화 시킴.

크기 차이를 통해 데이터를 강조함

이 수치의 크기가 머신러닝 결과에 영향을 미침

 

반응형