● 인공지능, 분석/21.08 nipa_AI실무과정
[AI 응용 ML] 실습 | 1.3 범주형 자료의 요약 - 도수분포표
0ver-grow
2021. 8. 30. 16:12
반응형
범주형 자료를 요약하기 위해 도수분포표를 출력해보겠습니다.
A, B, C, D, E 이 다섯 명의 술자리 참여 횟수가 기록된 데이터를 저장한 파일인 drink.csv 파일을 이용하여 누가 제일 술자리에 자주 나왔는지 value_counts() 함수로 계산한 도수로 확인해봅시다.
drink.csv파일은 두 가지 구성 요소가 있습니다.
- Attend : 참석한 경우 1, 참석하지 않은 경우 0
- Name : 참석자의 이름
아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.
아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.
도수계산 함수
value_counts() 함수는 pandas Series의 도수를 구하여 출력하는 함수입니다. 아래와 코드를 사용하면 Name 열의 도수를 출력합니다.
drink['Name'].value_counts()
지시사항
- drink.csv에서 참석한 사람 중 이름에 따른 도수를 계산한 코드를 입력하여 drink_freq 에 저장해보세요.
수정할 코드
import pandas as pd
import numpy as np
# drink 데이터
drink = pd.read_csv("drink.csv")
"""
1. 도수 계산
"""
drink_freq = None
print("도수분포표")
print(drink_freq)
정답
import pandas as pd
import numpy as np
# drink 데이터
drink = pd.read_csv("drink.csv")
"""
1. 도수 계산
"""
drink_freq = drink[drink['Attend']==1]['Name'].value_counts()
print("도수분포표")
print(drink_freq)
반응형