[AI 응용 ML] 이론 | 3.3 RSS, MSE, MAE, 𝑹^𝟐 (결정 계수)
좋은 회귀 알고리즘 모델 평가하는 방법
목표를 얼마나 잘 달성했는지 정도를 평가해야 함
실제 값과 모델이 예측하는 값의 차이에 기반한 평가 방법 사용
예시
𝑅𝑆𝑆, 𝑀𝑆𝐸, 𝑀𝐴𝐸, 𝑀𝐴𝑃𝐸, 𝑅 2
RSS – 단순 오차
1. 실제 값과 예측 값의 단순 오차 제곱 합
2. 값이 작을수록 모델의 성능이 높음
3. 전체 데이터에 대한 실제 값과 예측하는 값의 오차 제곱의 총합
RSS 특징
• 가장 간단한 평가 방법으로 직관적인 해석이 가능함
• 그러나 오차를 그대로 이용하기 때문에 입력 값의 크기에 의존적임
• 절대적인 값과 비교가 불가능함
MSE, MAE – 절대적인 크기에 의존한 지표
MSE(Mean Squared Error)
평균 제곱 오차, RSS 에서 데이터 수 만큼 나눈 값작을수록 모델의 성능이 높다고 평가할 수 있음.
MAE(Mean Absolute Error)
평균 절댓값 오차, 실제 값과 예측 값의 오차의 절대값의 평균 작을수록 모델의 성능이 높다고 평가할 수 있음.
• MSE: 이상치(Outlier) 즉, 데이터들 중 크게 떨어진 값에 민감함
• MAE: 변동성이 큰 지표와 낮은 지표를 같이 예측할 시 유용
• 가장 간단한 평가 방법들로 직관적인 해석이 가능함
• 그러나 평균을 그대로 이용하기 때문에 입력 값의 크기에 의존적임
• 절대적인 값과 비교가 불가능함
𝑹^𝟐 (결정 계수)
회귀 모델의 설명력을 표현하는 지표 1에 가까울수록 높은 성능의 모델이라고 해석할 수 있음
𝑻𝑺𝑺는 데이터 평균 값(𝑦 ത)과 실제 값(𝑦 𝑖 ) 차이의 제곱
𝑹^𝟐 (결정 계수)의 특징
• 오차가 없을수록 1에 가까운 값을 가짐
• 값이 0인 경우, 데이터의 평균 값을 출력하는 직선 모델을 의미함
• 음수 값이 나온 경우, 평균값 예측 보다 성능이 좋지 않음