Dit artikel gaat in detail in op de studie van tijdreeksen. Het doel van deze studie is om het gedrag van deze reeksen te analyseren om hun componenten te begrijpen en voorspellingen te doen.
Definitie
Een tijdreeks is een reeks gegevens die de evolutie van een fenomeen in de tijd weergeeft. Ze wordt gekenmerkt door :
Component 1, de trend: algemene evolutie van de reeks
Component 2, seizoensgebondenheid: variatie in waarden over een bepaalde tijdsperiode (week / maand / jaar)
Component 3, ruis (of residu): gebeurtenissen die niet kunnen worden voorspeld
Met behulp van de bovenstaande 3 componenten en de juiste keuze van het statistische model is het mogelijk om de gegevens samen te vatten en de toekomst te voorspellen.
Hoe kies je een model?
Er zijn twee hoofdtypen modellen:
Het additieve model, waarbij de drie componenten bij elkaar worden opgeteld
Het multiplicatieve model waarbij de drie componenten worden vermenigvuldigd
Om te beslissen welk model we moeten gebruiken, moeten we kijken of het seizoen toe- of afneemt met de trend.
De methode om deze observatie uit te voeren is als volgt:
Maxima aan elkaar koppelen
De minimumniveaus koppelen
Bestudeer het parallellisme tussen de twee rechte lijnen
Als de lijnen parallel lopen, is het additieve model het meest geschikt; als de lijnen divergeren, moet het multiplicatieve model worden gekozen.
Voorbeelden van toepassingen van deze modellen :
In het voorbeeld hierboven kunnen we zien dat voor het voorbeeld links de afstand tussen de twee lijnen min of meer gelijk blijft. Het additieve model is daarom het meest geschikt.
Methodologie voor statistische decompositie
Tijdreeksen kunnen daarom worden opgesplitst in 3 componenten.
In het additieve model beginnen we met het berekenen van de trend. Deze kan op verschillende manieren worden geschat met een parametrische methode (zoals dekleinste kwadraten berekening). Afhankelijk van het model kan de trendcurve :
lineair: y = a t + b
kwadratisch / orde 2: y = a t² + b t + c
exponentieel: y = a exp(wt)
ARIMAvoor niet-stationaire reeksen
Voor seizoensgebondenheid is het de bedoeling om een patroon te vinden dat zich in de tijd herhaalt. We moeten de trendcomponent verwijderen en onderscheid maken tussen de periode van het seizoen en de reden ervoor.
De ruis of rest is wat overblijft na het verwijderen van de trend- en seizoenscomponenten. Deze wordt meestal geschat opwitte Gaussiaanse ruis.
Opmerking:Voor een multiplicatief model kunnen we terugkeren naar een additief model door de natuurlijke logaritme van de tijdreeks te nemen en dus de vorige decompositie
Het aandeel van elk van deze componenten kan worden beoordeeld door hun variantie en die van de tijdreeks te berekenen. Wiskundig verklaart de variantie de afwijking van een curve van het gemiddelde. Van devariantie van de tijdreeks en die van zijn componenten, kunnen we het aandeel van de variantie van elk van deze componenten berekenen. Hoe groter het variantieaandeel van een component, hoe meer deze het fenomeen zal verklaren. Een sterk seizoensgebonden markt zal bijvoorbeeld een seizoensgebonden component met een hoge variantie hebben.
Opmerking:De som van de variantieaandelen van de drie componenten is niet 100% (de som van de kwadraten is niet noodzakelijk gelijk aan het kwadraat van de som). Het kan echter worden omgerekend naar 100%.
Toepassing van een voorspellend model
Zodra de drie componenten van een tijdreeks zijn geïdentificeerd, is het nu mogelijk om een voorspellend model te maken.
De drie delen van de tijdreeks worden bepaald en kunnen worden berekend door door de dagen te bladeren (het model wordt berekend voor één dag na de einddatum).
Het is erg belangrijk om een tijdreeks correct op te splitsen om de meest nauwkeurige voorspelling te doen.