diesem Artikel wird das Studium von Zeitreihen detailliert beschrieben. Ziel dieser Studie ist es, das Verhalten dieser Reihen zu analysieren, um ihre Komponenten zu verstehen und Vorhersagen zu treffen.
Definition
Eine Zeitreihe ist ein Datensatz, der die zeitliche Entwicklung eines Phänomens darstellt. Es ist gekennzeichnet durch:
Komponente 1, der Trend: allgemeine Entwicklung der Serie
Komponente 2, Saisonalität: Variation der Werte über einen definierten Zeitraum (Woche / Monat / Jahr)
Komponente 3, Rauschen (oder Rückstände): Ereignisse, die nicht vorhergesagt werden können
Aus den drei oben genannten Komponenten und der richtigen Auswahl eines statistischen Modells ist es möglich, die Daten zusammenzufassen und die Zukunft vorherzusagen.
Wie wähle
Modell aus?
Es gibt zwei Hauptmodelltypen:
Das additive Modell, in dem wir die drei Komponenten
Das multiplikative Modell, bei dem wir die drei Komponenten multiplizieren
summieren
Um das zu verwendende Modell auszuwählen, müssen Sie beobachten, ob die Saison mit dem Trend zunimmt oder abnimmt.
Die Methode zur Durchführung dieser Beobachtung lautet wie folgt:
Verbinden Sie die Maxima zwischen ihnen
Verbinden Sie die Minima zwischen ihnen
Untersuchen Sie die Parallelität zwischen den beiden Linien
Wenn die Linien parallel sind, ist das additive Modell am besten geeignet. Wenn die Linien divergieren, sollte das multiplikative Modell
Beispielanwendungen dieser Modelle:
Im obigen Beispiel sehen wir für das Beispiel links, dass der Unterschied zwischen den beiden Linien ungefähr gleich bleibt. Das additive Modell ist also am besten geeignet.
Statistische Methodik der Zerlegung
Somit kann die Zeitreihe in 3 Komponenten unterteilt werden.
Im additiven Modell berechnen wir zunächst den Trend. Es kann auf verschiedene Arten über eine parametrische Methode geschätzt werden (geben Sie Berechnung der kleinsten Quadrate ein ). Die Trendlinie kann je nach Modell wie folgt lauten:
linear: y = a t + b
quadratisch / Ordnung 2: y = a t² + bt + c
exponentiell: y = a exp (wt)
ARIMA : für instationäre Serien
Für die Saisonalität besteht das Ziel darin, ein Muster zu finden, das sich über eine zeitliche Frequenz wiederholt. Wir müssen die Trendkomponente entfernen und den Zeitraum der Saison und ihren Grund unterscheiden.
Das Rauschen, bei dem der Rückstand nach dem Entfernen der Trend- und saisonalen Komponenten übrig bleibt. Es wird allgemein geschätzt, dass es sich um weißes Gaußsches Rauschen .
Hinweis: Für ein multiplikatives Modell können wir auf ein additives Modell reduzieren, indem wir den natürlichen Logarithmus der Zeitreihe und damit die vorherige Zerlegung
Wir können den Anteil jeder dieser Komponenten bewerten, indem wir die Varianz der letzteren und der Zeitreihen berechnen. Mathematisch erklärt die Varianz die Abweichung einer Kurve vom Mittelwert. Aus der Varianz der Zeitreihe und das seiner Komponenten können wir den Anteil der Varianz jeder dieser Komponenten berechnen. Je größer der Anteil der Varianz einer Komponente ist, desto mehr wird das Phänomen erklärt. Ein Markt mit einer starken Saisonalität hat also eine saisonale Komponente mit einer hohen Varianz.
Hinweis: Die Summe der Teile der Varianz der drei Komponenten beträgt nicht 100% (die Summe der Quadrate entspricht nicht unbedingt dem Quadrat der Summe). Es kann jedoch auf 100% umbasiert werden.
Predictive Model Application
Wenn die drei Komponenten einer Zeitreihe identifiziert sind, ist es jetzt möglich, ein Vorhersagemodell zu erstellen.
Die drei Teile der Zeitreihe werden bestimmt. Es ist möglich, sie durch Scrollen durch die Tage zu berechnen (wir berechnen das Modell für einen Tag nach dem Enddatum).
Es ist sehr wichtig, die Zerlegung einer Zeitreihe durchzuführen, um anschließend mit der genauesten Vorhersage erfolgreich zu sein.