Badanie szeregów czasowych

Sezonowość, trend i prognozy: co musisz wiedzieć

A
Napisane przez Anthony Cabos
Zaktualizowano ponad tydzień temu

tym artykule szczegółowo omówiono badanie szeregów czasowych. Celem tego badania jest analiza zachowania tych szeregów w celu zrozumienia jego składników i dokonania prognoz.

Definicja

Szeregi czasowe to zbiór danych, które reprezentują ewolucję zjawiska w czasie. Charakteryzuje się:

  • Składnik 1, trend: ogólna ewolucja serii

  • Składnik 2, sezonowość: zmienność wartości w określonym przedziale czasu (tydzień / miesiąc / rok)

  • Składnik 3, szum (lub pozostałość): zdarzenia, których nie można przewidzieć

Na podstawie 3 powyższych komponentów i właściwego doboru modelu statystycznego możliwe jest podsumowanie danych i przewidywanie przyszłości.

Jak wybrać model?

Istnieją dwa główne typy modeli:

  • Model addytywny, w którym sumujemy trzy składniki

  • Model multiplikatywny, w którym mnożymy trzy składniki

Aby wybrać model, którego chcesz użyć, musisz obserwować, czy sezon rośnie, czy maleje wraz z trendem.

Metoda dokonywania tej obserwacji jest następująca:

  • Połącz maksima między nimi

  • Połącz minima między nimi

  • Zbadaj równoległość między dwiema liniami

  • Jeśli proste są równoległe, najbardziej odpowiedni jest model addytywny, jeśli linie się rozchodzą, należy wybrać model multiplikatywny

Przykładowe zastosowania tych modeli:

W powyższym przykładzie, w przykładzie po lewej stronie, różnica między dwoma wierszami pozostaje w przybliżeniu taka sama. Zatem model addytywny jest najbardziej odpowiedni.

Metodologia statystyczna rozkładu

W ten sposób szeregi czasowe można podzielić na 3 części.
W modelu addytywnym zaczynamy od obliczenia trendu. Można to oszacować na kilka sposobów metodą parametryczną (wpisz obliczenia metodą najmniejszych kwadratów ). Linia trendu może, w zależności od modelu, wyglądać następująco:

  • liniowe: y = a t + b

  • kwadratowe / rząd 2: y = a t² + bt + c

  • wykładniczy: y = a exp (wt)

  • ARIMA : dla niestacjonarnych seriali

W przypadku sezonowości celem jest znalezienie wzoru, który powtarza się z częstotliwością czasową. Musimy usunąć składnik trendu i rozróżnić okres sezonu i jego przyczynę.

Szum, w którym pozostałość jest pozostałością po usunięciu trendu i składników sezonowych. Ogólnie szacuje się, że jest to biały szum Gaussa .

Uwaga: W przypadku modelu multiplikatywnego możemy zredukować do modelu addytywnego, biorąc logarytm naturalny szeregu czasowego, a tym samym do jego poprzedniej dekompozycji.

Możemy oszacować udział każdego z tych składników, obliczając wariancję drugiego i szeregu czasowego. Matematycznie, wariancja wyjaśnia odchylenie krzywej od średniej. Z wariancji szeregów czasowych i jego składników możemy obliczyć proporcję wariancji każdego z tych składników. Im większy udział wariancji składnika, tym bardziej będzie on wyjaśniał zjawisko. Tak więc rynek o silnej sezonowości będzie miał swój składnik sezonowy o dużej zmienności.
Uwaga: Suma części wariancji trzech składników nie wynosi 100% (suma kwadratów niekoniecznie jest równa kwadratowi sumy). Jednak można ją zmienić w 100%.

Aplikacja modelu predykcyjnego

Po zidentyfikowaniu trzech składników szeregu czasowego można teraz zbudować model predykcyjny.
Wyznaczone są trzy części szeregu czasowego, można go obliczyć przewijając dni (model obliczamy na jeden dzień po dacie końcowej).
Bardzo ważne jest, aby przeprowadzić dekompozycję szeregu czasowego, aby później uzyskać jak najdokładniejszą prognozę.

Czy to odpowiedziało na twoje pytanie?