Undersøgelse af tidsserier

Sæsonbestemthed, tendens og forudsigelse: hvad du har brug for at vide

A
Skrevet af Anthony Cabos
Opdateret over en uge siden

Denne artikel beskriver studiet af tidsserier. Formålet med denne undersøgelse er at analysere opførelsen af disse serier for at forstå dens komponenter og komme med forudsigelser.

Definition

En tidsserie er et datasæt, der repræsenterer udviklingen af et fænomen over tid. Det er kendetegnet ved:

  • Komponent 1, tendensen: generel udvikling af serien

  • Komponent 2, sæsonbestemthed: variation i værdier over en defineret tidsperiode (uge / måned / år)

  • Komponent 3, støj (eller rest): begivenheder, der ikke kan forudsiges

Fra de 3 komponenter ovenfor og det rigtige valg af en statistisk model er det muligt at opsummere dataene og forudsige fremtiden.

Hvordan vælger du din model?

Der er to hovedtyper af modeller, der er:

  • Additivmodellen, hvor vi sammenfatter de tre komponenter

  • Den multiplikative model, hvor vi multiplicerer de tre komponenter

For at vælge hvilken model du skal bruge, skal du observere, om sæsonen stiger eller falder med tendensen.

Metoden til at foretage denne observation er som følger:

  • Forbind maksimumene mellem dem

  • Forbind minimaerne mellem dem

  • Undersøg paralleliteten mellem de to linjer

  • Hvis linjerne er parallelle, er additivmodellen den mest hensigtsmæssige. Hvis linjerne afviger, skal den multiplikative model vælges

Eksempel på anvendelser af disse modeller:

I eksemplet ovenfor ser vi for eksemplet til venstre forskellen mellem de to linjer forbliver omtrent den samme. Så additivmodellen er den mest egnede.

Nedbrydningens statistiske metode

Tidsserierne kan således opdeles i 3 komponenter.
I additivmodellen starter vi med at beregne tendensen. Det kan estimeres på flere måder via en parametrisk metode (skriv mindste kvadrat beregning ). Trendlinjen kan, afhængigt af modellen, være:

  • lineær: y = a t + b

  • kvadratisk / rækkefølge 2: y = a t² + bt + c

  • eksponentiel: y = en exp (wt)

  • ARIMA : til ikke-stationære serier

For sæsonbestemthed er målet at finde et mønster, der gentages over en tidsmæssig frekvens. Vi skal fjerne trendkomponenten og skelne sæsonperioden og årsagen til den.

Støj, hvor resten er, hvad der er tilbage efter fjernelse af trend og sæsonbestemte komponenter. Det anslås generelt at være Gaussisk hvid støj .

Bemærk: For en multiplikativ model kan vi reducere til en additivmodel ved at tage den naturlige logaritme fra tidsserien og dermed til dens tidligere nedbrydning

Vi kan evaluere andelen af hver af disse komponenter ved at beregne variansen for sidstnævnte og for tidsserien. Matematisk forklarer varians afvigelsen af en kurve fra gennemsnittet. Fra variansen fra tidsserien og dets komponenter, kan vi beregne andelen af variansen for hver af disse komponenter. Jo større andel af en komponents varians, jo mere vil det forklare fænomenet. Således vil et marked med en stærk sæsonbestemthed have sin sæsonbestemte komponent med stor varians.
Bemærk: Summen af de tre komponenters variansdele er ikke 100% (summen af kvadrater er ikke nødvendigvis lig med kvadratet af summen). Det kan dog omlægges til 100%.

Forudsigelig

Når de tre komponenter i en tidsserie identificeres, er det nu muligt at opbygge en forudsigende model.
De tre dele af tidsserien bestemmes, det er muligt at beregne det ved at rulle gennem dagene (vi beregner modellen for en dag efter slutdatoen).
Det er meget vigtigt at udføre nedbrydningen af en tidsserie for efterfølgende at lykkes med den mest nøjagtige forudsigelse.

Besvarede dette dit spørgsmål?