Questo articolo descriverà in dettaglio lo studio delle serie temporali. L'obiettivo di questo studio è analizzare il comportamento di queste serie per comprenderne i componenti e fare previsioni.
Definizione
Una serie temporale è un insieme di dati che rappresenta l'evoluzione di un fenomeno nel tempo. È caratterizzato da:
Componente 1, il trend: evoluzione generale della serie
Componente 2, stagionalità: variazione dei valori in un periodo di tempo definito (settimana / mese / anno)
Componente 3, rumore (o residuo): eventi che non possono essere previsti
Dalle 3 componenti precedenti e dalla giusta scelta di un modello statistico, è possibile riassumere i dati e prevedere il futuro.
Come scegliere il modello?
Esistono due tipi principali di modello che sono:
Il modello additivo in cui sommiamo i tre componenti
Il modello moltiplicativo in cui moltiplichiamo le tre componenti
Per scegliere quale modello utilizzare, bisogna osservare se la stagione aumenta o diminuisce con il trend.
Il metodo per eseguire questa osservazione è il seguente:
Collega i massimi tra di loro
Collega i minimi tra di loro
Studia il parallelismo tra le due linee
Se le linee sono parallele, il modello additivo è il più appropriato, se le linee divergono, dovrebbe essere scelto il modello moltiplicativo
Esempi di applicazioni di questi modelli:
Nell'esempio sopra, vediamo per l'esempio a sinistra, la differenza tra le due linee rimane approssimativamente la stessa. Quindi il modello additivo è il più adatto.
Metodologia statistica della decomposizione
Pertanto la serie temporale può essere suddivisa in 3 componenti.
Nel modello additivo, iniziamo calcolando la tendenza. Può essere stimato in diversi modi tramite un metodo parametrico (digita calcolo dei minimi quadrati ). La linea di tendenza può, a seconda del modello, essere:
lineare: y = a t + b
quadratico / ordine 2: y = a t² + bt + c
esponenziale: y = a exp (wt)
ARIMA : per serie non fisse
Per la stagionalità, l'obiettivo è trovare uno schema che si ripeta su una frequenza temporale. Dobbiamo rimuovere la componente trend e distinguere il periodo della stagione e la sua ragione.
Il rumore in cui il residuo è ciò che rimane dopo aver rimosso la tendenza e le componenti stagionali. In genere si stima che sia rumore bianco gaussiano .
Nota: per un modello moltiplicativo, possiamo ridurre a un modello additivo prendendo il logaritmo naturale della serie temporale e quindi alla sua scomposizione precedente
Possiamo valutare la quota di ciascuna di queste componenti calcolando la varianza di quest'ultima e quella delle serie storiche. Matematicamente, la varianza spiega la deviazione di una curva dalla media. Dalla varianza della serie temporale e quella delle sue componenti, possiamo calcolare la proporzione della varianza di ciascuna di queste componenti. Maggiore è la quota della varianza di un componente, più spiegherà il fenomeno. Pertanto, un mercato con una forte stagionalità avrà la sua componente stagionale con un'elevata varianza.
Nota: la somma delle parti della varianza delle tre componenti non è del 100% (la somma dei quadrati non è necessariamente uguale al quadrato della somma). Tuttavia, può essere ribasato al 100%.
Applicazione modello predittivo
Quando vengono identificate le tre componenti di una serie temporale, è ora possibile costruire un modello predittivo.
Si determinano le tre parti della serie storica, è possibile calcolarla scorrendo i giorni (calcoliamo il modello per un giorno dopo la data di fine).
È molto importante effettuare la scomposizione di una serie temporale per riuscire, successivamente, con la previsione più accurata.