Studie av tidsserier

Sesongmessighet, trend og spådom: det du trenger å vite

A
Skrevet av Anthony Cabos
Oppdatert over en uke siden

Denne artikkelen vil detaljere studiet av tidsserier. Målet med denne studien er å analysere oppførselen til disse seriene for å forstå komponentene og komme med spådommer.

Definisjon

En tidsserie er et datasett som representerer utviklingen av et fenomen over tid. Det er preget av:

  • Komponent 1, trenden: generell evolusjon av serien

  • Komponent 2, sesongmessighet: variasjon av verdier over en definert tidsperiode (uke / måned / år)

  • Komponent 3, støy (eller rester): hendelser som ikke kan forutsies

Fra de 3 komponentene ovenfor og riktig valg av en statistisk modell, er det mulig å oppsummere dataene og forutsi fremtiden.

Hvordan velger du modellen din?

Det er to hovedtyper av modeller som er:

  • Tilsetningsmodellen der vi summerer de tre komponentene

  • Multiplikasjonsmodellen der vi multipliserer de tre komponentene

For å velge hvilken modell du skal bruke, må du observere om sesongen øker eller avtar med trenden.

Metoden for å gjøre denne observasjonen er som følger:

  • Koble maksimumene mellom dem

  • Koble minima mellom dem

  • Studer parallelliteten mellom de to linjene

  • Hvis linjene er parallelle, er tilsetningsmodellen den mest hensiktsmessige. Hvis linjene avviker, bør multiplikasjonsmodellen velges

Eksempel på applikasjoner av disse modellene:

I eksemplet ovenfor ser vi for eksemplet til venstre at forskjellen mellom de to linjene forblir omtrent den samme. Så additivmodellen er den mest passende.

Statistisk metodikk for nedbrytningen

Dermed kan tidsseriene deles inn i 3 komponenter.
I tilsetningsmodellen starter vi med å beregne trenden. Det kan estimeres på flere måter via en parametrisk metode (skriv minste kvadrat beregning ). Avhengig av modell kan trendlinjen være:

  • lineær: y = a t + b

  • kvadratisk / rekkefølge 2: y = a t² + bt + c

  • eksponentiell: y = a exp (wt)

  • ARIMA : for ikke-stasjonære serier

For sesongmessighet er målet å finne et mønster som gjentas over en tidsmessig frekvens. Vi må fjerne trendkomponenten og skille mellom sesongperioden og årsaken.

Støyen der resten er det som er igjen etter å ha fjernet trenden og sesongbestanddelene. Det anslås vanligvis å være Gaussisk hvit støy .

Merk: For en multiplikativ modell kan vi redusere til en additivmodell ved å ta den naturlige logaritmen til tidsserien og dermed til den forrige nedbrytningen

Vi kan evaluere andelen av hver av disse komponentene ved å beregne variansen til sistnevnte og tidsserien. Matematisk forklarer varians avviket til en kurve fra gjennomsnittet. Fra variansen til tidsserien og komponentene, kan vi beregne andelen av variansen til hver av disse komponentene. Jo større andel av variansen til en komponent, jo mer vil den forklare fenomenet. Dermed vil et marked med sterk sesongmessighet ha sin sesongbestemte komponent med høy varians.
Merk: Summen av delene av variansen til de tre komponentene er ikke 100% (summen av kvadrater er ikke nødvendigvis lik kvadratet av summen). Imidlertid kan den avgrenses til 100%.

Forutsigbar

Når de tre komponentene i en tidsserie er identifisert, er det nå mulig å bygge en prediktiv modell.
De tre delene av tidsserien er bestemt, det er mulig å beregne den ved å bla gjennom dagene (vi beregner modellen for en dag etter sluttdatoen).
Det er veldig viktig å nedbryte en tidsserie for å lykkes, med den mest nøyaktige spådommen.

Svarte dette på spørsmålet?