반응형
명목형 자료 변환하기 - 더미 방식
명목형 자료를 수치형 자료로 변환하는 방식으로 더미 방식이 있습니다.
titanic 데이터에서 범주형 자료인 Embarked 데이터는 S, Q, C 3가지 값을 가지고 있습니다.
이를 더미 방식을 사용하여 변환해봅시다.
titanic 데이터 구성
지시사항
- Embarked의 S, Q, C데이터를 더미를 사용하여 변환하고 dummies에 저장해 봅시다.
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())
"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = None
# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())
※ 힌트
pandas의 DataFrame에서 이를 수행하기 위하여 get_dummies를 사용합니다.
pd.get_dummies(DataFrame[[변수명]])
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())
"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = pd.get_dummies(titanic[["Embarked"]])
# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())
반응형
'● 인공지능, 분석 > 21.08 nipa_AI실무과정' 카테고리의 다른 글
[AI 응용 ML] 실습 | 2.6 수치형 자료 변환하기_정규화 / 표준화 (0) | 2021.08.31 |
---|---|
[AI 응용 ML] 이론 | 2.5 수치형 자료 전처리 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 2.3 명목형 자료 변환_수치맵핑 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.2 범주형 자료 전처리 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.1 전처리 (0) | 2021.08.31 |