반응형
범주형 자료를 요약하기 위해 도수분포표를 출력해보겠습니다.
A, B, C, D, E 이 다섯 명의 술자리 참여 횟수가 기록된 데이터를 저장한 파일인 drink.csv 파일을 이용하여 누가 제일 술자리에 자주 나왔는지 value_counts() 함수로 계산한 도수로 확인해봅시다.
drink.csv파일은 두 가지 구성 요소가 있습니다.
- Attend : 참석한 경우 1, 참석하지 않은 경우 0
- Name : 참석자의 이름
아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.
아래 그림은 drink.head(), drink.info()코드의 출력 형태 입니다.
도수계산 함수
value_counts() 함수는 pandas Series의 도수를 구하여 출력하는 함수입니다. 아래와 코드를 사용하면 Name 열의 도수를 출력합니다.
drink['Name'].value_counts()
지시사항
- drink.csv에서 참석한 사람 중 이름에 따른 도수를 계산한 코드를 입력하여 drink_freq 에 저장해보세요.
수정할 코드
import pandas as pd
import numpy as np
# drink 데이터
drink = pd.read_csv("drink.csv")
"""
1. 도수 계산
"""
drink_freq = None
print("도수분포표")
print(drink_freq)
정답
import pandas as pd
import numpy as np
# drink 데이터
drink = pd.read_csv("drink.csv")
"""
1. 도수 계산
"""
drink_freq = drink[drink['Attend']==1]['Name'].value_counts()
print("도수분포표")
print(drink_freq)
반응형
'● 인공지능, 분석 > 21.08 nipa_AI실무과정' 카테고리의 다른 글
[AI 응용 ML] 실습 | 1.5 수치형 자료의 요약 - 평균 (0) | 2021.08.30 |
---|---|
[AI 응용 ML] 실습 | 1.4 범주형 자료의 요약 - 막대그래프 (0) | 2021.08.30 |
[AI 응용 ML] 이론 | 1.2 자료 형태란? | 수치형자료 범주형자료 (0) | 2021.08.30 |
[AI 응용 ML] 이론 | 1.1 인공지능/머신러닝 개론 | 지도학습, 비지도학습, 강화학습 (0) | 2021.08.30 |
[AI 기본 데분] 이론 | 1.4 Pandas | loc : 명시적 인덱싱 | iloc : 암묵적 인덱싱 (0) | 2021.08.22 |