● 인공지능, 분석/21.08 nipa_AI실무과정
[AI 응용 ML] 실습 | 2.4 명목형 자료 변환_더미방식
0ver-grow
2021. 8. 31. 14:08
반응형
명목형 자료 변환하기 - 더미 방식
명목형 자료를 수치형 자료로 변환하는 방식으로 더미 방식이 있습니다.
titanic 데이터에서 범주형 자료인 Embarked 데이터는 S, Q, C 3가지 값을 가지고 있습니다.
이를 더미 방식을 사용하여 변환해봅시다.
titanic 데이터 구성
지시사항
- Embarked의 S, Q, C데이터를 더미를 사용하여 변환하고 dummies에 저장해 봅시다.
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())
"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = None
# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())
※ 힌트
pandas의 DataFrame에서 이를 수행하기 위하여 get_dummies를 사용합니다.
pd.get_dummies(DataFrame[[변수명]])
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())
"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = pd.get_dummies(titanic[["Embarked"]])
# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())
반응형