● 인공지능, 분석/21.08 nipa_AI실무과정
[AI 응용 ML] 실습 | 2.3 명목형 자료 변환_수치맵핑
0ver-grow
2021. 8. 31. 13:58
반응형
명목형 자료 변환하기 - 수치 맵핑
머신러닝의 입력으로 사용하기 위하여 명목형 자료를 수치형 자료로 변환할 필요가 있습니다.
titanic 데이터에서 범주형 자료인 성별(Sex) 데이터는 male, female 값을 가지고 있습니다. 이를 0, 1 인 수치형 자료로 변환해 봅시다.
titanic 데이터 구성
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Sex'].head())
"""
1. replace를 사용하여 male -> 0, female -> 1로 변환합니다.
"""
titanic = None
# 변환한 성별 데이터를 출력합니다.
print('\n변환 후: \n',titanic['Sex'].head())
힌트
pandas의 DataFrame에서 이를 수행하기 위하여 replace를 사용합니다. 아래는 A -> B, C->D,… 변환하는 코드입니다.
DataFrame.replace({A:B, C:D,...})
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Sex'].head())
"""
1. replace를 사용하여 male -> 0, female -> 1로 변환합니다.
"""
titanic = titanic.replace({'male':0, 'female':1})
# 변환한 성별 데이터를 출력합니다.
print('\n변환 후: \n',titanic['Sex'].head())
반응형