위키/데이터분석

회귀모델 평가지표 - R2 score 결정계수, MAE, MSE, RMSE, MAPE, MPE

서윤L 2024. 7. 4. 22:12
728x90
반응형

 

 

R² score = 결정계수

  • R² score 는 회귀모델이 데이터에 얼마나 적합한지 나타내는 지표입니다. 
  • 1에 가까울수록, 모델 성능이 좋다고 평가합니다.

  • 회귀모델의 기본적인 평가지표는 아래와 같이 계산합니다.
    ✔️ SSE = 오차제곱합 = ∑(예측값과 실제값의 차이)²
    ✔️ SSR = 회귀제곱합 = (예측값과 평균값의 차이)²
    ✔️ SST = 전체제곱합 = ∑(실제값과 평균값의 차이)²
    ✔️ R² score = 결정계수 = SSR / SST = 1 - (SSE / SST)

 

✅ 오차 = 실제값과 예측값의 차이 를 이용한 평가지표들

  • MAE = Mean Absolute Error = 평균 절대 오차 = |예측값과 실제값의 차이|² / 전체 개수
    - 오차가 작을수록 = MAE값이 작을수록, 모델 성능이 좋음.


  • MSE = Mean Squared Error = 평균 제곱 오차 = ∑(예측값과 실제값의 차이)² / 전체 개수
    - 오차가 작을수록 = MSE값이 작을수록, 모델 성능이 좋음.
    - 제곱을 취하기 때문에, 특이값이 있는 경우 영향을 크게 받음. 즉 특이값에 민감한 지표.
  • RMSE = Root Mean Squared Error = 평균 제곱근 오차
    - MSE에 루트를 씌워서 값을 축소시킨 지표. RMSE값이 작을수록, 모델 성능이 좋음.

  • MAPE = Mean Absolute Percentage Error = 평균 절대 백분율 오차
    - MAE를 비율(%)로 나타낸 지표. 백분율이므로 다른 모델과 비교하기 좋음.
    - MAPE값이 작을수록 = 0%에 가까울수록, 모델 성능이 좋음.
  • MPE = Mean Percentage Error = 평균 백분율 오차
    - MPE에서 절댓값을 제외한 지표. 백분율이므로 다른 모델과 비교하기 좋음.
    - MAPE값이 0%에 가까울수록, 모델 성능이 좋음.

 

728x90
반응형