tym artykule szczegółowo omówiono badanie szeregów czasowych. Celem tego badania jest analiza zachowania tych szeregów w celu zrozumienia jego składników i dokonania prognoz.
Definicja
Szeregi czasowe to zbiór danych, które reprezentują ewolucję zjawiska w czasie. Charakteryzuje się:
Składnik 1, trend: ogólna ewolucja serii
Składnik 2, sezonowość: zmienność wartości w określonym przedziale czasu (tydzień / miesiąc / rok)
Składnik 3, szum (lub pozostałość): zdarzenia, których nie można przewidzieć
Na podstawie 3 powyższych komponentów i właściwego doboru modelu statystycznego możliwe jest podsumowanie danych i przewidywanie przyszłości.
Jak wybrać model?
Istnieją dwa główne typy modeli:
Model addytywny, w którym sumujemy trzy składniki
Model multiplikatywny, w którym mnożymy trzy składniki
Aby wybrać model, którego chcesz użyć, musisz obserwować, czy sezon rośnie, czy maleje wraz z trendem.
Metoda dokonywania tej obserwacji jest następująca:
Połącz maksima między nimi
Połącz minima między nimi
Zbadaj równoległość między dwiema liniami
Jeśli proste są równoległe, najbardziej odpowiedni jest model addytywny, jeśli linie się rozchodzą, należy wybrać model multiplikatywny
Przykładowe zastosowania tych modeli:
W powyższym przykładzie, w przykładzie po lewej stronie, różnica między dwoma wierszami pozostaje w przybliżeniu taka sama. Zatem model addytywny jest najbardziej odpowiedni.
Metodologia statystyczna rozkładu
W ten sposób szeregi czasowe można podzielić na 3 części.
W modelu addytywnym zaczynamy od obliczenia trendu. Można to oszacować na kilka sposobów metodą parametryczną (wpisz obliczenia metodą najmniejszych kwadratów ). Linia trendu może, w zależności od modelu, wyglądać następująco:
liniowe: y = a t + b
kwadratowe / rząd 2: y = a t² + bt + c
wykładniczy: y = a exp (wt)
ARIMA : dla niestacjonarnych seriali
W przypadku sezonowości celem jest znalezienie wzoru, który powtarza się z częstotliwością czasową. Musimy usunąć składnik trendu i rozróżnić okres sezonu i jego przyczynę.
Szum, w którym pozostałość jest pozostałością po usunięciu trendu i składników sezonowych. Ogólnie szacuje się, że jest to biały szum Gaussa .
Uwaga: W przypadku modelu multiplikatywnego możemy zredukować do modelu addytywnego, biorąc logarytm naturalny szeregu czasowego, a tym samym do jego poprzedniej dekompozycji.
Możemy oszacować udział każdego z tych składników, obliczając wariancję drugiego i szeregu czasowego. Matematycznie, wariancja wyjaśnia odchylenie krzywej od średniej. Z wariancji szeregów czasowych i jego składników możemy obliczyć proporcję wariancji każdego z tych składników. Im większy udział wariancji składnika, tym bardziej będzie on wyjaśniał zjawisko. Tak więc rynek o silnej sezonowości będzie miał swój składnik sezonowy o dużej zmienności.
Uwaga: Suma części wariancji trzech składników nie wynosi 100% (suma kwadratów niekoniecznie jest równa kwadratowi sumy). Jednak można ją zmienić w 100%.
Aplikacja modelu predykcyjnego
Po zidentyfikowaniu trzech składników szeregu czasowego można teraz zbudować model predykcyjny.
Wyznaczone są trzy części szeregu czasowego, można go obliczyć przewijając dni (model obliczamy na jeden dzień po dacie końcowej).
Bardzo ważne jest, aby przeprowadzić dekompozycję szeregu czasowego, aby później uzyskać jak najdokładniejszą prognozę.