본문 바로가기
● 인공지능, 분석/21.08 nipa_AI실무과정

[AI 응용 ML] 실습 | 1.3 범주형 자료의 요약 - 도수분포표

by 0ver-grow 2021. 8. 30.
반응형

범주형 자료를 요약하기 위해 도수분포표를 출력해보겠습니다.

A, B, C, D, E 이 다섯 명의 술자리 참여 횟수가 기록된 데이터를 저장한 파일인 drink.csv 파일을 이용하여 누가 제일 술자리에 자주 나왔는지 value_counts() 함수로 계산한 도수로 확인해봅시다.

 

drink.csv파일은 두 가지 구성 요소가 있습니다.

  • Attend : 참석한 경우 1, 참석하지 않은 경우 0
  • Name : 참석자의 이름

아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.

 

아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.

도수계산 함수

value_counts() 함수는 pandas Series의 도수를 구하여 출력하는 함수입니다. 아래와 코드를 사용하면 Name 열의 도수를 출력합니다.

drink['Name'].value_counts()

 

지시사항

  1. drink.csv에서 참석한 사람 중 이름에 따른 도수를 계산한 코드를 입력하여 drink_freq 에 저장해보세요.

수정할 코드

import pandas as pd 
import numpy as np

# drink 데이터
drink = pd.read_csv("drink.csv")

"""
1. 도수 계산
"""
drink_freq = None

print("도수분포표")
print(drink_freq)

정답

import pandas as pd 
import numpy as np

# drink 데이터
drink = pd.read_csv("drink.csv")

"""
1. 도수 계산
"""
drink_freq = drink[drink['Attend']==1]['Name'].value_counts()

print("도수분포표")
print(drink_freq)
반응형