이 기사는 시계열 연구에 대해 자세히 설명합니다. 이 연구의 목적은 구성 요소를 이해하고 예측하기 위해 이러한 시리즈의 동작을 분석하는 것입니다.
정의
시계열은 시간에 따른 현상의 진화를 나타내는 일련의 데이터입니다. 특징 :
성분 1, 추세 : 시리즈의 일반적인 진화
성분 2, 계절성 : 정의 된 기간 (주 / 월 / 년) 동안 값의 변화
성분 3, 노이즈 (또는 잔류) : 예측할 수없는 사건
위의 세 가지 구성 요소와 통계 모델의 올바른 선택에서 데이터를 요약하고 미래를 예측할 수 있습니다.
모델을 선택하는 방법은 무엇입니까?
두 가지 주요 모델 유형이 있습니다.
세 가지 요소를 더한 가법 모델
세 가지 구성 요소를 곱하는 곱셈 모델
사용할 모델을 선택하려면 계절이 추세에 따라 증가하는지 감소하는지 관찰해야합니다.
이를 관찰하는 방법은 다음과 같습니다.
둘 사이에 최대 값 연결
둘 사이에 최소값 연결
두 선 사이의 병렬성 연구
선이 평행하면 덧셈 모델이 가장 좋고, 선이 갈라지면 곱셈 모델을 선택해야합니다.
이 모델의 적용 예 :
위의 예에서 왼쪽의 예를 보면 두 줄의 차이가 거의 동일하게 유지됩니다. 따라서 가산 모델이 가장 적합합니다.
분해 통계 방법론
따라서 시계열은 3 개의 구성 요소로 나눌 수 있습니다.
가산 모델에서는 추세를 계산하는 것으로 시작합니다. 매개 변수 방법 ( 최소 제곱 계산 유형)을 통해 여러 방법으로 추정 할 수 있습니다. ). 추세선은 모델에 따라 다음과 같을 수 있습니다.
선형 : y = a t + b
2 차 / 차수 2 : y = a t² + bt + c
지수 : y = a exp (wt)
ARIMA : 비정상 시리즈 용
계절성의 경우 목표는 시간적 빈도에 걸쳐 반복되는 패턴을 찾는 것입니다. 트렌드 구성 요소를 제거하고 시즌 기간과 이유를 구분해야합니다.
추세 및 계절 성분을 제거한 후 잔류 물이 남아있는 노이즈입니다. 일반적으로 가우스 백색 잡음 으로 추정됩니다.
참고 : 곱셈 모델의 경우 시계열의 자연 로그를 취하여 이전 분해로 가산 모델로 줄일 수 있습니다.
우리는 후자와 시계열의 분산을 계산하여 이러한 각 구성 요소의 점유율을 평가할 수 있습니다. 수학적으로 분산은 평균에서 곡선의 편차를 설명합니다. 시계열 분산 그리고 그 구성 요소의 각 구성 요소의 분산 비율을 계산할 수 있습니다. 구성 요소의 분산 비율이 클수록 현상을 더 많이 설명합니다. 따라서 계절성이 강한 시장은 변동성이 큰 계절 구성 요소를 갖게됩니다.
참고 : 세 성분의 분산 부분의 합이 100 %가되지는 않습니다 (제곱의 합이 반드시 합의 제곱과 같지는 않음). 그러나 100 %로 리베이스 할 수 있습니다.
예측 모델 적용
시계열의 세 가지 구성 요소가 식별되면 이제 예측 모델을 구축 할 수 있습니다.
시계열의 세 부분이 결정되며, 날짜를 스크롤하여 계산할 수 있습니다 (종료일 이후 하루 동안 모델을 계산합니다).
가장 정확한 예측으로 성공하기 위해서는 시계열 분해를 수행하는 것이 매우 중요합니다.