developer-ellen
인간 디버거의 로그 찍기
developer-ellen
전체 방문자
오늘
어제
  • 분류 전체보기 (217)
    • 회고록 (0)
    • 취뽀 및 커리어 여정의 Stack (2)
      • SSAFY 7기 (2)
    • 프로그래밍공부 (24)
      • c++ (0)
      • JAVA (3)
      • Spring (5)
      • design pattern (3)
      • BackDB (1)
      • Servlet&JSP (3)
      • Vue (4)
      • JPA (4)
      • Infra (1)
      • Linux (0)
    • AI (3)
      • papers (3)
      • trend (0)
    • 프로젝트진행 (0)
      • 데이터베이스 (0)
      • 서버개발 (0)
      • 인공지능 (0)
      • 하루정리 (0)
    • 포트폴리오 (0)
    • 알고리즘 (158)
      • 알고리즘문풀 (155)
      • 알고리즘공부 (3)
    • 통계공부 (15)
      • 시계열분석 (15)
      • 회귀분석 (0)
    • CS (14)
      • 컴퓨터네트워크 (4)
      • 운영체제 (8)
      • 데이터베이스 (2)
    • 주저리주저리 (0)
      • 필사 (0)
    • 취업관련정보 (0)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 통계학
  • 삼성코테구현풀이
  • 운영체제인터럽트
  • 삼성코테자바준비
  • 시계열분석
  • 코테파이썬
  • 삼성코테파이썬준비
  • Arima
  • 삼성코테구현문제추천
  • c++ 빌더 패턴
  • AR모형
  • 시계열
  • ARIMA모형
  • 삼성코테기출자바풀이
  • 카카오코테java풀이
  • 삼성코테자바풀이
  • 삼성코테준비
  • 삼성코테자바꿀팁
  • 데이터분석
  • 삼성코테기출
  • BOJ파이썬풀이
  • 통계분석
  • SW역량테스트파이썬풀이
  • 백준파이썬풀이
  • MA모형
  • 삼성코테파이썬풀이
  • c++디자인패턴
  • 삼성코테파이썬
  • 카카오코테
  • SW역량테스트파이썬

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
developer-ellen

인간 디버거의 로그 찍기

시계열 자료의 예측 정확도 측정
통계공부/시계열분석

시계열 자료의 예측 정확도 측정

2021. 4. 13. 09:41

예측의 정확도 측정

  • 예측은 과거부터 예측하고자 하는 시점까지 얻어진 시계열자료들을 이용하여 이후 시점에서의 그 자료의 값을 알아내는 것
  • 이러한 예측값이 얼마나 정확한가를 측정해야함
  • 어떤 시계열자료에 대해 몇 가지 방법으로 예측할 경우 어느방법으로 예측한 결과가 가장 적당한가를 알기위해서는 예측값들로 그 예측방법의 정확도를 측정하여 비교해야 함

 

시계열의 예측 오차

1) 예측시점(T)에 대해 n개의 이전 시점들의 시계열자료를 갖고 있다고 할 때, 여기서 예측 시점이란 현재 시점을 뜻하는 것이 아니라 예측하고자 하는 그 시점이다.

 

2) n개의 시계열 자료들로 어떤 예측방법을 사용하여 향후 m개 시점들에 대한 예측값을 얻는다면

3) 이 예측방법에 의하여 예측하고자 하는 시점부터 과거 n개의 자료들을 역으로 계산할 경우

4) 실제로 이미 알고 있는 시계열 자료 { Y(T-(n-1)), ... , Y(T-1), Y(T) } 와 예측모형을 통하여 얻어지는 시계열 {F(T-(n-1)), ... , F(T-1), F(T) } 간의 차이는 그 예측모형에 의하여 얻게되는 오차들이 되며, 이 오차들을 이용하여 예측모형의 정확도를 계산할 수 있다.

 

 

예측 오차 

  • 예측오차(error) = 실제값 - 예측값
  • 오차들을 가지고 예측모형의 정확도를 측정하며, 실제로 얻어진 시계열 자료값들에 대해서 실제로 계산된 오차들을 잔차(residual)
  • 시계열자료에서는 시점 T를 기준으로 m 시점에 걸쳐 시계열의 관찰값 { Y(T+1), ... , Y(T+m) } 이 있을 경우, { Y(T+1) - F(T+1), ... , Y(T+m) - F(T+m) } 도 계산될 수 있을 것이고 이 값들을 예측오차(forecasting error)라고 하며, 잔차를 e로 표현한다.

 

 

 

예측방법의 정확도 측정하는 방법 (잔차를 이용한 평가 기준)

1) Mean Error(ME) : 계산된 잔차들의 단순평균

2) Mean Absolute Error(MAE) : 잔차들의 절댓값들을 평균한 것

3) Mean Sqauared Error(MSE, 평균제곱오차) : 잔차들의 평균을 0이라고 하고(실제로 0에 가까움) 잔차들의 제곱 평균을 구한 것이며, 이때 SSE(잔차제곱합)을 이용함

4) Standard Deviation of Errors(SDE) : 잔차들에 대한 표준편차

5) Mean Percentage Error (MPE) : 잔차들의 실제 자료에 대한 비율 평균

6) Mean Absolute Percentage Error(MAPE) : 잔차의 실제 자료에 대한 비율의 절대값들의 평균

7) Durbin-Waston Statistic : 자기상관이 존재하는가를 판단하는 척도

 

 

  • 일반적으로 사용되는 정확도의 척도는 잔차제곱합(SSE) 또는 평균제곱오차(MSE)이며 통계적인 의미나 활용도가 높음
  • 정확도를 구하는 방법들 중 어느 방법이 가장 좋은지를 판단할 수 없지만 여러 가지 다른 예측방법으로 예측값들을 얻었을 경우,  그 예측방법들에 대한 여러 가지 정확도들을 구하여 대체적인 비교를 함으로써 주어진 시계열자료에 대해서는 어떤 예측방법이 더 타당한지 알 수 있을 뿐
  • 물론 두 가지 예측방법을 비교할 때 정확도를 기준으로 판단하려면 계산된 정확도의 값이 더 작은 것이 더 바람직한 방법이 됨

 

 

 

정확도 측정의 예시

어느 제품의 반품개수 시계열 자료와 특정한 예측방법의 예측값들이 다음과 같다고 할떄, 이 자료의 대한 정확도를 계산하기 위한 과정과 여러 가지 정확도의 값들은 다음과 같다.

 

1) ME= 0.2

2) MAE = 3.6

3) MSE = 16

4) SDE = 4.22

5) MPE = -1.385(%)

6) MAPE = 9.383(%)

 

 

7) D-W : 359 / 160 = 2.24375

 

'통계공부 > 시계열분석' 카테고리의 다른 글

평활법 - 지수평활방법  (0) 2021.04.15
평활법 - 이동평균방법  (0) 2021.04.14
시계열의 기본개념 및 변동요인  (0) 2021.04.13
시계열 분석의 자료와 예측 (2)  (0) 2021.04.13
시계열 분석의 자료와 예측 (1)  (0) 2021.04.12
    '통계공부/시계열분석' 카테고리의 다른 글
    • 평활법 - 지수평활방법
    • 평활법 - 이동평균방법
    • 시계열의 기본개념 및 변동요인
    • 시계열 분석의 자료와 예측 (2)
    developer-ellen
    developer-ellen

    티스토리툴바