pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다.

dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있는데요.

import pandas as pd

two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]]

my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a', 'b', 'c', 'd'])

print(my_df.dtypes)

###
name             object
english_score     int64
math_score        int64
dtype: object
###

위 경우 'name' column은 object라는 데이터 타입을 보관하고,

'english_score'와 'math_score' column은 int64라는 데이터 타입을 보관하는 거죠.

보시다시피 한 column 내에서는 모든 값이 동일한 데이터 타입입니다.

pandas의 dtype들

pandas에 담을 수 있는 dtype(데이터 타입) 몇 가지를 살펴봅시다.

dtype	설명
int64	정수
float64	소수
object	텍스트
bool	불린(참과 거짓)
datetime64	날짜와 시간
category	카테고리

csv파일은 ,(comma)를 기준으로 열이 구분된다.

컬럼명이 있는 행(첫 행)을 header라고 한다.

read_csv를 사용하면 첫 행을 헤더로 자동 인식한다.

import pandas as pd
df = pd.read_csv('file.csv')

만약 헤더가 없다면, 하단처럼 header=None값을 넣어줘야한다.

헤더값이 None이면 0,1,2,... 순으로 칼럼명이 기재된다.

import pandas as pd
df = pd.read_csv('file.csv', header=None)

row명 변경하기.

0번째 칼럼을 row명으로 지정해보자

import pandas as pd
df = pd.read_csv('file.csv', index_col=0)

저작자표시 비영리 동일조건 (새창열림)

'○ 인공지능, 분석 > 21.07 코드잇_DS과정' 카테고리의 다른 글

3-5. DataFrame 이론 및 실전 \| indexing, 칼럼 출력, 2개 파일 통합 (0)	2021.09.10
3-4. DataFrame 실전 \| DataFrame으로 파일 출력하기 (0)	2021.09.10
3-2. DataFrame 실전 \| 리스트로 되어 있는 이름, 생일, 직업을 df로 변환하기 (0)	2021.05.31
3-1. DataFrame 이론 \| Numpy와 Pandas DF의 차이점. DF 만들기 (31)	2021.05.29
2-2. Numpy 실전 \| numpy array에 곱셉연산. Boolean연산 (0)	2021.05.29

DataPlanet

3-3. DataFrame 이론 | pandas의 데이터 타입

pandas의 dtype들

row명 변경하기.

'○ 인공지능, 분석 > 21.07 코드잇_DS과정' 카테고리의 다른 글

티스토리툴바

3-3. DataFrame 이론 | pandas의 데이터 타입

pandas의 dtype들

row명 변경하기.

'○ 인공지능, 분석 > 21.07 코드잇_DS과정' 카테고리의 다른 글

관련글

티스토리툴바