[5. 분석] 파이썬 데이터 분석 패키지 시작
파이썬 데이터 분석 패키지 (패키지명 : 기능 / 주요함수) numpy : 배열 계산, 반올림, 버리기 기능 / floor, ceil, power pandas : 데이터 프레임으로 데이터 입력 및 가공 / describe, groupby matplotlib : 그래프 그리기 / plot, hist, bar 기타패키지 : math, scipy(통계 분석), statsmodels(통계 모델 작성 및 분석) 등 패키지 설치하기 pip install 패키지명 pip install numpy 파이썬 이외 여러 통계 분석 도구들 SPSS : 초보자도 쉽게 사용 가능 파이썬, R : 통계에 대한 이해가 있고 여러 표를 동시 출력하고 싶다면 스크립트 기반의 이것을 사용할 것 R : 경제학자들이 애용하는 프로그램. 스크..
2021. 1. 12.
[4. CSV] CSV 파일 데이터 분석하기
Numpy, Pandas로 쉽게 데이터 분석이 가능하다. 하지만 CSV형 리스트 활용법을 배우는 이유는 1. 반복문과 조건문 연습에 도움 2. 파이썬의 리스트 기능(인덱스, 슬라이싱, 원소 꺼내기_pop 등) 사용 가능 3. 논리적 사고를 하는데 도움 import os, re, usecsv total = usecsv.opencsv('popseoul.csv') newPop = usecsv.switch(total) print(newPop[:4]) ''' [['Gu', 'Korean', 'Foreigner', 'Senior'], ['Total', 9740398.0, 285529.0, 1468146.0], ['Jongrogu', 151767.0, 11093.0, 27394.0], ['Jongru', 126409..
2021. 1. 11.
[4. CSV] try except문 활용하기
하단 코드의 한계는 뭘까? >>> p = ['123Jongrogu', '151,000', '102,305' ,'25,456'] >>> for j in i : if re.search('[a-z가-힣]',j) : # 알파벳, 한글인 경우 그대로 사용 i[i.index(j)] = j # i.index(j)는 j가 있는 인덱스 번호 else : # 알파벳, 한글이 아닌 경우, 하단 형태로 수정 i[i.index(j)] = (float(re.sub(',','',j))) >>> i ['Jongrogu', 151767.0, 11093.0, 27394.0] 바로, p 요소 중 알파벳과 한글이 아닌 요소(특수문자, 빈 문자열 등)가 있을 때, 오류가 발생한다는 것이다 이 때 예외처리를 적용하면 간단해진다. >>> i =..
2021. 1. 11.
[4. CSV] 수정한 요소 새로 적재하기 vs 수정한 요소 덮어쓰기
1. 수정한 요소 새로 적재하기 수정한 요소를 새로 적재하기 위해 리스트 타입의 k 객체를 만든다. >>> import re >>> p = ['123Jongrogu', '151,000', '102,305' ,'25,456'] >>> k = [] # 리스트 객체 >>> for j in p : if re.search('[a-z가-힣]', j) : # j에 알파벳이나 한글이 있다면 k.append(j) # 그대로 k에 저장 else : k.append(float(re.sub(',','',j))) >>> k ['123Jongrogu', 151000.0, 102305.0, 25456.0] 2. 수정한 요소 덮어쓰기 새 객체를 선언할 필요가 없이 그대로 덮어쓰자. 이를 위해선 인덱스를 활용하면 된다. >>> p =..
2021. 1. 11.
[4. CSV] CSV 수정하기, 쉼표제거
수정할 파일 >>> import os,re >>> os.getcwd() 'C:\\WINDOWS\\System32' >>> os.chdir(r'C:\Users\JE\Desktop') >>> import usecsv >>> total = usecsv.opencsv('popSeoul.csv') # 이파일도 동일한 위치에 존재 >>> for i in total[:5] : print(i) ['Gu', 'Korean', 'Foreigner', 'Senior'] ['Total', '9,740,398', '285,529', '1,468,146'] ['Jongrogu', '151,767', '11,093', '27,394'] ['Jongru', '126,409', '10,254', '23,025'] ['Yongsangu..
2021. 1. 9.
튜플이란? j = 1,444,000이 튜플이 되는 이유?
튜플이란?(출처링크1, 출처링크2)튜플(tuple)은 몇 가지 점을 제외하곤 리스트와 거의 비슷하며 리스트와 다른 점은 다음과 같다.리스트는 [ ]으로 둘러싸지만 튜플은 ( )으로 둘러싼다.리스트는 그 값의 생성, 삭제, 수정이 가능하지만 튜플은 요솟값은 한 번 정하면 지우거나 변경할 수 없다튜플은 값을 변화시킬 수 없다는 점만 제외하면 리스트와 완전히 동일 (인덱싱[1], 슬라이싱[1:], 길이len, 연산) 튜플의 형태# 빈 튜플을 제외하고 괄호를 쓰지 않아도 된다. >>> t1 = () # 빈 튜플은 괄호 >>> t2 = (1,) # 원소가 하나라면 원소, 로 표시 >>> t3 = (1, 2, 3) >>> t4 = 1, 2, 3 >>> t5 = ('a', 'b', ('ab', 'cd'))튜플의 특징..
2021. 1. 7.