본문 바로가기
● 인공지능, 분석/21.08 nipa_AI실무과정

[AI 응용 ML] 실습 | 2.4 명목형 자료 변환_더미방식

by 0ver-grow 2021. 8. 31.
반응형

명목형 자료 변환하기 - 더미 방식

명목형 자료를 수치형 자료로 변환하는 방식으로 더미 방식이 있습니다.

titanic 데이터에서 범주형 자료인 Embarked 데이터는 S, Q, C 3가지 값을 가지고 있습니다.

이를 더미 방식을 사용하여 변환해봅시다.

titanic 데이터 구성

지시사항

  1. Embarked의 S, Q, C데이터를 더미를 사용하여 변환하고 dummies에 저장해 봅시다.

문제

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()
   
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())

"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = None

# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())

 

 

※ 힌트

pandas의 DataFrame에서 이를 수행하기 위하여 get_dummies를 사용합니다.

pd.get_dummies(DataFrame[[변수명]])

 

정답

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()
   
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Embarked'].head())

"""
1. get_dummies를 사용하여 변환합니다.
"""
dummies = pd.get_dummies(titanic[["Embarked"]])

# 변환한 Embarked 데이터를 출력합니다.
print('\n변환 후: \n',dummies.head())
반응형