본문 바로가기
● 인공지능, 분석/20.08 K-ICT

[K-ICT] 머신러닝을 위한 통계학

by 0ver-grow 2020. 8. 11.
반응형

 

머신러닝과 통계학은 닮은 점이 많다.

데이터 수집, 분석, 해석, 표현 과정뿐만 아니라 용어, 이론까지!

통계학은 수학이므로 머신러닝과 통계 모델을 다루는 과정에서 수학 이론에 대한 이해가 필요하다

 

대부분의 통계분석은 표본을 통해 진행함. 표본 대상의 통계 분석이 비용면에서 효율적

모집단은 인구총조사.

 

펜스밖은 이상치.

이상치가 들어간 상태에서 통계분석을 하게되면 통계 결과의 신뢰성을 잃는다.

IQR은 이상치를 판별하여 통계 결과의 신뢰성을 높임

 

문제

4등분 = 4분위수(백등분 = 백분위수)

4등분하려면 5개의 숫자가 필요해 0, 25, 50, 75, 100

귀무가설의 채택 기준

현재 우리가 검정해야하는 것?

표본이 하나라서 단일 표본이다. 이를 단일 표본 t검정, one sample t Test라고 한다.

정규분포를 따르는 표본에 대해 기대값을 조사할 때 사용하는 분석법

 

검정 통계량으로 t 통계량을 사용한다.

 

 

 

반응형