반응형
수치형 자료 변환하기 - 정규화
수치형 자료의 경우 다른 수치형 자료와 범위를 맞추기 위해 정규화 또는 표준화를 수행합니다.
이번 실습에서는 titanic 데이터에서 수치형 자료인 Fare 데이터를 정규화해보겠습니다.
정규화 공식
titanic 데이터 구성
지시사항
- normal 함수를 완성하고 Fare 데이터를 정규화하여 Fare에 저장합니다.
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
"""
1. 정규화를 수행하는 함수를 구현합니다.
"""
def normal(data):
data = None
return data
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())
# normal 함수를 사용하여 정규화합니다.
Fare = normal(titanic['Fare'])
# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())
Tips
DataFrame에서 min(), max() 메서드를 사용하여 변환을 수행해보세요. min(), max()는 각각 최소, 최대값을 출력하는 메서드입니다.
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
"""
1. 정규화를 수행하는 함수를 구현합니다.
"""
def normal(data):
data = (data-data.min()) / (data.max()-data.min())
return data
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())
# normal 함수를 사용하여 정규화합니다.
Fare = normal(titanic['Fare'])
# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())
수치형 자료 변환하기 - 표준화
수치형 자료의 경우 다른 수치형 자료와 범위를 맞추기 위해 정규화 또는 표준화를 수행합니다.
이번 실습에서는 titanic 데이터에서 수치형 자료인 Fare 데이터를 표준화해보겠습니다.
표준화 공식
titanic 데이터 구성
지시사항
- standard 함수를 완성하고 Fare 데이터를 표준화하여 Fare에 저장합니다.
Tips!
DataFrame에서 mean(), std() 메서드를 사용하여 변환을 수행해보세요. mean(), std()는 각각 평균, 표준편차를 출력하는 메서드입니다.
문제
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
"""
1. 표준화를 수행하는 함수를 구현합니다.
"""
def standard(data):
data = ❤❤❤
return data
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())
# standard 함수를 사용하여 표준화합니다.
Fare = standard(titanic['Fare'])
# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())
정답
import pandas as pd
from elice_utils import EliceUtils
elice_utils = EliceUtils()
"""
1. 표준화를 수행하는 함수를 구현합니다.
"""
def standard(data):
data = (data-data.mean())/data.std()
return data
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())
# standard 함수를 사용하여 표준화합니다.
Fare = standard(titanic['Fare'])
# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())
반응형
'● 인공지능, 분석 > 21.08 nipa_AI실무과정' 카테고리의 다른 글
[AI 응용 ML] 실습 | 2.8 결측값 처리하기 (0) | 2021.08.31 |
---|---|
[AI 응용 ML] 이론 | 2.7 데이터 정제 및 분리 (0) | 2021.08.31 |
[AI 응용 ML] 이론 | 2.5 수치형 자료 전처리 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 2.4 명목형 자료 변환_더미방식 (0) | 2021.08.31 |
[AI 응용 ML] 실습 | 2.3 명목형 자료 변환_수치맵핑 (0) | 2021.08.31 |