본문 바로가기
반응형

● 인공지능, 분석/21.07 코드잇_DS과정13

3-11. DataFrame 이론 | 인덱스, 칼럼명 설정하기 position이란 칼럼의 앞 글자를 대문자로 수정해보자 하지만 위처럼 바꾸면 실제 df에 반영이 되지 않는다. 하단 처럼 작성해야한다. 첫번째 칼럼에는 이름이 없다. 여기에 Player Name을 부여하자 인덱스를 Player Name이 아니라 Number로 해주고 싶다면? +. 이렇게만 작성하면 DF에 반영이 안됨. inplace=True를 넣어줘야됨 🚫 여기서 주의할 점! 위 처럼 작성하면 기존의 선수이름이 삭제된다. 고로 기존의 인덱스를 새 컬럼에 지정해줘야 한다. 즉, 인덱스 -> 컬럼 으로 옮겨야한다. 이제 인덱스를 NUmber 칼럼으로 바꿔보자 💥💥💥 퀴즈 : 서류 전형 합격 여부' 조건 1. 각 파트가 최소 250점, 총 점수가 최소 600점이 되어야 서류 전형을 합격 2. “합격 여부”라.. 2021. 9. 10.
3-10. DataFrame 이론 | Row, Column 값 추가, 삭제 기존 데이터프레임 값 추가하기 아이폰XR 정보도 추가하려면? 다음처럼 정보 수정하듯이 작성하면 된다. 제조사라는 칼럼을 새로만들어서 모두 apple이란 값을 넣어보자. 값 삭제하기 기존의 DF를 건드리지 않고 아이폰XR 삭제하기. (row값 삭제하기) 기존 DF에서 아이폰XR 삭제하기 아이폰7, 아이폰8, 아이폰X 삭제하기 (여러 행 삭제하기) 문제 : 잘못된 데이터프레임 고치기1 ID 1의 무게를 200으로 변경하세요. ID 21의 row를 삭제하세요. ID 20의 row를 추가하세요. ID 20의 키는 70, 무게는 200입니다. 정답 코드 import pandas as pd df = pd.read_csv('data/body_imperial1.csv', index_col=0) # 코드를 작성하세요. .. 2021. 9. 10.
3-9. DataFrame 이론 | Row, Column 값 변경하기 하나의 Ro,w Column 변경하기 주어진 DataFrame 1. 아이폰8의 메모리를 바꿔보자. (특정 행,열을 지정하여 수정) 2. 아이폰8의 전체 정보를 바꿔보자 (1개의 행 전체 정보 변경) 행이기 때문에 loc를 사용한다. 3. ''디스플레이'' 칼럼 정보를 바꿔보자. (칼럼 1개 전체를 변경하자) 4. Face ID칼럼의 값을 전부 'Yes'로 바꿔보자. (만약 칼럼을 동일한 값으로 변경하고자 한다면?) 값을 하나만 넣으면 된다. 여러 Row를 한번에 변경하기 5. 디스플레이, Face ID칼럼을 x로 변경하기. (여러 칼럼을 한번에 변경하기) 6. 아이폰7, 아이폰X를 전부 o로 변경하기. (여러 행을 한번에 변경하기) 7. 디스플레이가 5보다 큰 것들만 인덱싱해보기 인덱싱 후 값 변경 il.. 2021. 9. 10.
3-8. DataFrame 이론 | DafaFrame Indexing 정리 이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"]] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row .. 2021. 9. 10.
3-7. DataFrame 이론 및 실전 | 위치로 인덱싱(iloc) 정수위치로 인덱싱하기 : iloc (integer location) 주어진 DafaFrame iloc 적용하기 (모든 숫자는 인덱스의 번호를 상징) 1. 인덱스 2번째 행, 4번째 열을 출력해보자. 2. 1,3번 row의 1,4번 column을 출력해보자. 3. 연속된 인덱싱하기 2021. 9. 10.
3-6. DataFrame 이론 및 실전 | 연속 행▪열 출력, boolean, 조건 필터링 indexing import pandas as pd df = pd.read_csv('data/iphone.csv', index_col=0) iPhone X, iPhone 8 정보 가져오기. (행 2개 가져오기) 1차원은 Series 2차원은 DataFrame 연속된 row를 출력해보자 iPhone X까지 출력하기 df.loc[:'iPhone X'] 연속된 column(메모리 칼럼 ~ Face ID 칼럼)을 출력해보자. df.loc[ : , '메모리' : 'Face ID' ] Boolean 0,2,3,5 칼럼만 출력하기 df.loc=[[True, False, True, True, False, True , False]] 전체 칼럼에 대해 Boolean값을 작성하지 않았다면? 작성하지 않은 칼럼들에 대해선 F.. 2021. 9. 10.
3-5. DataFrame 이론 및 실전 | indexing, 칼럼 출력, 2개 파일 통합 indexing import pandas as pd df = pd.read_csv('data/iphone.csv', index_col=0) 특정 row, column 출력하기 행을 출력하려면 loc를 사용한다. 행과 열을 출력할때도 loc를 사용 열만 출력할 때는 loc없어도 됨. (단, 연속된 column을 출력할 때는 loc 사용) iphone 8(행)의 메모리(열)를 출력해보자 df.loc['iPhone 8','메모리'] # 행, 열을 지정 iPhone X의 전체 행을 출력해보자 df.loc['iPhone 8'] # 행 인덱스 네임만 입력 '출시일'을 출력해보자. (1가지 칼럼만 출력하기) df.loc[ : , '출시일'] # 칼럼 네임만 입력 df['출시일'] 출시일, 메모리를 출력해보자. (2가.. 2021. 9. 10.
3-4. DataFrame 실전 | DataFrame으로 파일 출력하기 Q1 ) DF변환하여 출력하기 조사 결과가 data 폴더의 popular_baby_names.csv라는 파일에 담겨 있는데요. 안에 있는 정보를 DataFrame으로 읽어 들이고, DataFrame을 출력 import pandas as pd df = pd.read_csv('data/popular_baby_names.csv') df Q2 ) 칼럼을 행의 제목으로 사용하기 data폴더의 mega_millions.csv 파일의 데이터를 DataFrame에 넣어 봅시다. 0번째 칼럼이 DataFrame의 인덱스가 되도록 해 주세요! import pandas as pd df = pd.read_csv('data/mega_millions.csv', index_col = 0) df 2021. 9. 10.
3-3. DataFrame 이론 | pandas의 데이터 타입 pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다. dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있는데요. import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a', 'b', 'c', 'd']) print(my_df.dtypes) ### name object english_score int64.. 2021. 9. 9.
3-2. DataFrame 실전 | 리스트로 되어 있는 이름, 생일, 직업을 df로 변환하기 문제 내 답안 import pandas as pd # 코드를 작성하세요. list_df = [ ['Taylor Swift','December 13, 1989','Singer-songwriter'], ['Aaron Sorkin','June 9, 1961','Screenwriter'], ['Harry Potter','July 31, 1980','Wizard'], ['Ji-Sung Park','February 25, 1981','Footballer'] ] # 칼럼명은 여기서 삽입 my_df = pd.DataFrame(list_df, columns=['name','birthday','occupation']) # 정답 출력 my_df 모범 답안 import pandas as pd celebrities = [ ['.. 2021. 5. 31.
3-1. DataFrame 이론 | Numpy와 Pandas DF의 차이점. DF 만들기 R과 파이썬 R의 데이터 보관, 정리, 분석을 담당하는 것이 DataFrame인데 이 기능을 Python의 Pandas Library가 가져옴 Numpy vs Pandas 넘파이 판다스의 DataFrame numpy를 기반으로 제작됨 numpy기능 + 데이터 정리, 분석 + 외부데이터 읽고쓰기 + 시각화 1차원, 2차원 2차원 형태의 데이터를 다루기 위한 자료형 표형식의 데이터를 담는 자료형 숫자인덱스로 값을 찾음 테이블의 모든 값이 같아야함 (주로 숫자로함) 숫자인덱스가 아닌 행,열에 붙여진 이름으로 값을 찾을 수 있음. 문자열 혹은 숫자로 보관하고 싶은 것을 구분해서 담을 수 있음 2차원 넘파이 : 한 테이블의 모든 값의 타입이 같아야함 넘파이는 주로 숫자위주 한 테이블에 다양한 자료를 담을 수 있음.. 2021. 5. 29.
2-2. Numpy 실전 | numpy array에 곱셉연산. Boolean연산 Q.1 >신주쿠 흥부부대찌개 엔화(¥)로 저장한 매출 데이터를 원화(₩)로 변환하는 작업이 필요. 엔화 매출이 담겨 있는 파이썬 리스트가 주어짐. 1엔에 10.08원이라고 가정하고, 원화 매출이 담긴 numpy array를 만들어 출력할 것. 기본 코드는 다음과 같다. import numpy as np revenue_in_yen = [ 300000, 340000, 320000, 360000, 440000, 140000, 180000, 340000, 330000, 290000, 280000, 380000, 170000, 140000, 230000, 390000, 400000, 350000, 380000, 150000, 110000, 240000, 380000, 380000, 340000, 420000, 1.. 2021. 5. 29.
2-1. Numpy 이론 | 넘파이배열과 파이썬 리스트의 차이점, 평균▪중간값 등등 크고 복잡한 데이터를 쉽게 계산하게 도와주는 넘파이. numerical python 수치계산을 돕는 파이썬 도구 넘파이가 중요한 이유? 넘파이 배열 ( numpy array) = 파이썬 리스트와 비슷함 일반적인 파이썬 리스트로 배열을 작성하면 코드가 길고 연산 시간이 오래 걸림 numpy array와 python list의 차이점 문법 차이 간단한 문법과 뛰어난 성능 numpy array python list 덧셈, 곱셈 동일한 배열 2가지를 덧셈 연산하면? [10,5,3] + [10,5,3] = [20,10,6] 배열 전체에 곱셉 계산하면? [1,2,3] * 2 = [2,4,6] 동일한 배열 2가지를 덧셈 연산하면? [10,5,3] + [10,5,3] = [10,5,3,10,5,3] 배열 전체에 곱셈 .. 2021. 5. 29.
반응형