본문 바로가기
● 인공지능, 분석/20.08 생코_머신러닝

생활코딩_오렌지3를 활용한 데이터 분석

by 0ver-grow 2020. 8. 17.
반응형

 

 

통계와 시각화 - 생활코딩

통계와 시각화 2020-08-03 22:39:39 통계와 시각화 boxplot 산점도와 상관관계 상관관계와 인과관계 

opentutorials.org

대표값

평균값, 중앙값

평균값 = 중앙값 : 좁게 분포

평균값 > 중앙값 : 넓게 분포

분포는 4분위수로 파악

 

Barplot

ScatterPlot산점도와 상관관계

상관관계 : 독립변수와 종속변수의 관계.

이 변수들 무엇인지 산점도를 통해 파악해보자.

 

두 변수간의 연관성이 있을 때

데이터가 골고루 배치되어 있을 때

위 선은 최소한의 비용으로 관통하는 선

 

중간에 데이터가 모여있다면 값들이비슷한애들이있따는것을알수있고

특이하게 동 떨어져있다면 그건 이상치, 불평등 데이터 일 수도

 

상관관계가 없을 때는 다음처럼 뒤죽박죽이다.

상관관계와 인과관계

위 표를 통해 22.5도에서 얼마나 팔릴지를 예측할 수 있다

반응형