시계열의 요소분해법(decomposition)
- 평활방법은 시계열자료가 어떤 패턴에 따라 변화한다는 전제하에서 예측시점으로 부터 과거 시점의 자료들을 평균함으로싸(주로 가중평균), 시계열 변화 패턴의 부드러운 모습을 찾아보자는 것
- 시계열 요소분해법이란 시계열자료는 몇 가지 변동들의 혼합(결합)으로 이루어지는 것이므로, 시게열자료를 형성하고 있는 변동 요소들을 찾아내고 시계열자료를 그 요소들의 결합으로 표현한 후 장래시점에 대해 예측해 보는 것
- 실제로 우리가 분석하고자 하는 많은 시계열자료들은 대체로 추세(trend), 계절변동(seasonal fluctuation), 순환변동(cyclical movement)으로 이루어지며 기타 불규칙 변동(irregular/random fluctuation)이 추가되어 변화하는 모습을 갖음
- (정의) 분해법이란 시계열의 기본패턴(혹은 변동요인)을 개별성분(계절성, 추세성, 순환성, 불규칙성)으로 분해하여 시계열의 특성을 분석하고 또 분해된 각 성분을 개별적으로 예측한 후에 이들을 다시 결합시켜서 예측하는 방법
- 물론 평활방법과 요소분해방법 중 어느 방법이 더 좋다고 단정할 수는 없고, 경우에 따라서 평활방법으로 예측한 결과와 요소분해법으로 예측한 결과를 비교해보는 것이 바람직함
시계열의 요소
1) 추세(trend) 또는 추세성분(경향변동, 장기변동) : T(t)
- 추세란 자료가 장기적으로 변화해 가는 큰 흐름을 나타내는 것이며, 자료가 장기적으로 커지는지 작아지는지 변화가 없는 지를 나타내주는 요소를 추세라고 한다.
- 보통 직선 또는 이차식 등과 같은 다항식으로 설명할 수 있으며, 장기적으로 증가하는 모습일 때 그것이 선형(linear)인지, 지수적으로(exponentially) 증가하는지 등을 함수 관계로 표현할 수 있다.
2) 순환변동(cyclical movement), 순환성분 : C(t)
- 계절성분과 유사하게 변화하나 그 변화의 주기가 길 때의 변동을 의미하며 경기변동이라고 부르며, 단 그 주기는 일정하지 않다.
- 순환변동은 경기나 어떤 기업의 호황과 불황 등을 나타날 때 사용되기도 한다.
- 대표적인 예로 GNP(국민총생산), 산업생산지수, 주택수요, 자동차 판매대수, 주식가격, 통화공급량, 이자율 등..
- 경우에 따라서 어떤 시계열자료는 순환변동을 포함하고 있지 않을 수도 있다.
3) 계절변동(sesonal fuctuation), 계절성분 : S(t)
- 기온, 강수량, 월별효과 등과 같이 1년, 1개월, 1주 등의 일정한 주기를 가지고 규칙적으로 반복되는 변동성분을 의미하며 보통 1년 이내의 주기적인 변동을 의미한다.
- 즉 , 계절변동은 일정한 주기를 갖고 반복적으로 같은 패턴으로 변화하는 것을 말한다.
=> 순환변동과 계절변동의 차이점
- 계절변동은 주기가 일정하게 (1년, 1달, 1주 등) 정해진 반면, 순환변동은 정해지지 않은 기간 동안에 사이클을 보여주는 것이라 할 수 있다.
4) 불규칙 성분(우연성분) : I(t)
- 시간과 관계없이 설명하기 어려운 여러 가지 복합적인 원인에 의한 변동이며 예측할 수도 없고 관심의 대상도 아니다.
- 시계열 자료는 세 가지 변동을 기본으로 하여 불규칙하게 변화하는 형태를 갖는 시계열자료(Yt)는 세 가지 변동들 외에 오차를 포함하고 있다고 보아야 할 것이다. 이때, 시계열자료가 불규칙하게 변동하는 부분을 오차(error) 또는 잡음(noise)이라고 하는데 오차는 추세, 순환, 계쩔변동 외에 다른 잡다한 이유들에 의하여 불규칙하게 변하는 시계열자료의 성질을 나타내며 오차들의 평균은 0으로 간주한다.
=> 분해법은 시계열 Yt가 다음과 같은 형태로 이루어졌다고 가정한다.
시계열 요소의 분해 절차
- 시계열자료의 네가지 요소들을 각각으로 분해하는 절차
- 먼저, 시계열자료의 주기(N)를 파악한 후 N기의 이동평균을 구하면 계절성과 불규칙성(임의성)을 제거할 수 있다.
- 시계열자료(Yt)로 부터 1에서 구한 이동평균값들을 분리시키게 되면 시계열자료에는 추세변동과 순환변동만 남게 된다.
- 시계열자료의 추세가 어떤 형태로 이루어져 있는지를 알 수 있게 되고, 그 추세의 형태(Tt)를 구할 수 있다.
- 2에서 얻어진 추세변동과 순환변동만 남아 있는 시계열에서 3에서 구한 추세변동을 제거하면 순환변동(Ct)가 얻어진다.
- 우의 과정에서 얻어진 St, Tt, Ct를 모두 제거할 때 남는 것은 불규칙변동(It)이다.
=> 분해법의 모형에는 가법모형(additive model)과 승법모형(multiplicative model)이 존재한다.
분해법의 가법 모형
- 네 가지 요소들이 합하여진 시계열자료를 가법모형이라고 한다.
- 분해절차
1단계 : 시계열의 순환 및 추세성분의 추정값
- 시계열에 포함된 계절성과 불규칙성분을 제거하기 위하여 시계열의 m기간 중심이동평균을 한다.
2단계 : 계절성분 및 불규칙성분의 추정값
3단계 : 2단계에 S(t) + I(t)를 동일한 계졀별로 평균하여 불규칙 성분이 제거된 계절성분 S(t)를 추정
4단계 : 1단계의 Mt의 그래프에서 추세형태를 식별
5단계 : 순환성분
6단계 : 불규칙 성분
7단계 : 예측
분해법의 승법모형
- 여러 가지 변동 요소들이 단순히 더해지는 것이 아니라 서로 관련을 갖기 때문에 곱해지는 것으로 모형을 설정하는 것이다.
- 분해절차
1단계 : 시계열의 순환 및 추세성분의 추정값
- 시계열에 포함된 계절성과 불규칙성분을 제거하기 위하여 시계열의 m기간 중심이동평균을 한다.
2단계 : 계절성분 및 불규칙성분의 추정값
3단계 : 불규칙 성분이 제거된 순수한 계절성분(St)을 추정
4단계 : 1단계의 Mt의 그래프에서 추세형태 식별
5단계 : 순환성분
6단계 : 불규칙성분
7단계 : 예측
- 현재 시점 n에서 n+l 시점의 예측값 (단, 불규칙성에 대한 기댓값을 1로 간주)
=> 일반적으로 가법모형보다는 승법모형이 현실적이다. 가법모형은 다른 변동들이 어느정도인지에 상관없이 특정 변동이 일정하게 시계열자료(Yt)에 영향을 준다는 것이 전제가 되어 있는 반해, 승법모형은 특정변동이 Yt에 미치는 영향은 다른 변동들의 값에 따라 달라진다는 것을 반영한다는 모형이다. 따라서 대부분의 시계열자료는 승법모형으로 간주되며 분해법의 승법모형으로 요소를 분해하는 것이 일반적이다.
'통계공부 > 시계열분석' 카테고리의 다른 글
Box-Jenkins 모형 (1) (0) | 2021.04.16 |
---|---|
시계열 요소분해법 (2) (0) | 2021.04.16 |
평활법 - 지수평활방법 (0) | 2021.04.15 |
평활법 - 이동평균방법 (0) | 2021.04.14 |
시계열 자료의 예측 정확도 측정 (0) | 2021.04.13 |