본문 바로가기
● 인공지능, 분석/21.08 nipa_AI실무과정

[AI 응용 ML] 실습 | 2.6 수치형 자료 변환하기_정규화 / 표준화

by 0ver-grow 2021. 8. 31.
반응형

수치형 자료 변환하기 - 정규화

수치형 자료의 경우 다른 수치형 자료와 범위를 맞추기 위해 정규화 또는 표준화를 수행합니다.

이번 실습에서는 titanic 데이터에서 수치형 자료인 Fare 데이터를 정규화해보겠습니다.

정규화 공식

titanic 데이터 구성

지시사항

  1. normal 함수를 완성하고 Fare 데이터를 정규화하여 Fare에 저장합니다.

문제

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()

"""
1. 정규화를 수행하는 함수를 구현합니다.
"""
def normal(data):
    
    data = None
    
    return data

# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())

# normal 함수를 사용하여 정규화합니다.
Fare = normal(titanic['Fare'])

# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())

Tips

DataFrame에서 min(), max() 메서드를 사용하여 변환을 수행해보세요. min(), max()는 각각 최소, 최대값을 출력하는 메서드입니다.

 

정답

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()

"""
1. 정규화를 수행하는 함수를 구현합니다.
"""
def normal(data):
    
    data = (data-data.min()) / (data.max()-data.min())
    
    return data

# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())

# normal 함수를 사용하여 정규화합니다.
Fare = normal(titanic['Fare'])

# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())

수치형 자료 변환하기 - 표준화

수치형 자료의 경우 다른 수치형 자료와 범위를 맞추기 위해 정규화 또는 표준화를 수행합니다.

이번 실습에서는 titanic 데이터에서 수치형 자료인 Fare 데이터를 표준화해보겠습니다.

표준화 공식

titanic 데이터 구성

지시사항

  1. standard 함수를 완성하고 Fare 데이터를 표준화하여 Fare에 저장합니다.

Tips!

DataFrame에서 mean(), std() 메서드를 사용하여 변환을 수행해보세요. mean(), std()는 각각 평균, 표준편차를 출력하는 메서드입니다.

 

문제

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()

"""
1. 표준화를 수행하는 함수를 구현합니다.
"""
def standard(data):
    
    data = ❤❤❤
    
    return data
    
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())

# standard 함수를 사용하여 표준화합니다.
Fare = standard(titanic['Fare'])

# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())

 

정답

import pandas as pd
from elice_utils import EliceUtils

elice_utils = EliceUtils()

"""
1. 표준화를 수행하는 함수를 구현합니다.
"""
def standard(data):
    
    data = (data-data.mean())/data.std()
    
    return data
    
# 데이터를 읽어옵니다.
titanic = pd.read_csv('./data/titanic.csv')
print('변환 전: \n',titanic['Fare'].head())

# standard 함수를 사용하여 표준화합니다.
Fare = standard(titanic['Fare'])

# 변환한 Fare 데이터를 출력합니다.
print('\n변환 후: \n',Fare.head())
반응형