반응형
명목형 자료 변환하기 - 수치 맵핑
머신러닝의 입력으로 사용하기 위하여 명목형 자료를 수치형 자료로 변환할 필요가 있습니다.
titanic 데이터에서 범주형 자료인 성별(Sex) 데이터는 male, female 값을 가지고 있습니다. 이를 0, 1 인 수치형 자료로 변환해 봅시다.
titanic 데이터 구성
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Sex'].head())
"""
1. replace를 사용하여 male -> 0, female -> 1로 변환합니다.
"""
titanic = None
# 변환한 성별 데이터를 출력합니다.
print('\n변환 후: \n',titanic['Sex'].head())
힌트
pandas의 DataFrame에서 이를 수행하기 위하여 replace를 사용합니다. 아래는 A -> B, C->D,… 변환하는 코드입니다.
DataFrame.replace({A:B, C:D,...})
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Sex'].head())
"""
1. replace를 사용하여 male -> 0, female -> 1로 변환합니다.
"""
titanic = titanic.replace({'male':0, 'female':1})
# 변환한 성별 데이터를 출력합니다.
print('\n변환 후: \n',titanic['Sex'].head())
반응형
'● 인공지능, 분석 > 21.08 nipa_AI실무과정' 카테고리의 다른 글
[AI 응용 ML] 이론 | 2.5 수치형 자료 전처리 (0) | 2021.08.31 |
---|---|
[AI 응용 ML] 실습 | 2.4 명목형 자료 변환_더미방식 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.2 범주형 자료 전처리 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.1 전처리 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 1.7 수치형 자료의 요약 - 히스토그램 (0) | 2021.08.30 |