Cet article va détailler l'étude des séries temporelles. L'objectif de cette étude est d'analyser le comportement de ces séries afin d'en comprendre ses composantes et de réaliser des prévisions.
Définition
Une série temporelle est un ensemble de données qui représente l'évolution d'un phénomène au cours du temps. Elle est caractérisée par :
Composante 1, la tendance : évolution générale de la série
Composante 2, la saisonnalité : variation des valeurs sur une période de temps définie (semaine / mois / année)
Composante 3, le bruit (ou le résidu) : les événements qu'on ne peut pas prévoir
A partir des 3 composantes ci-dessus et du bon choix d'un modèle statistique, il est possible de résumer les données et de prédire le futur.
Comment choisir son modèle ?
On distingue deux principaux types de modèle qui sont :
Le modèle additif où on somme les trois composantes
Le modèle multiplicatif où on multiplie les trois composantes
Pour choisir quel est le modèle à utiliser, il faut observer si la saison augmente ou diminue avec la tendance.
La méthode pour réaliser cette observation est la suivante :
Relier les maxima entre eux
Relier les minima entre eux
Étudier le parallélisme entre les deux droites
Si les droites sont parallèles, le modèle additif est le plus judicieux, si les droites divergent, il faut choisir le modèle multiplicatif
Exemple d'applications de ces modèles :
Dans l'exemple ci-dessus, on constate pour l'exemple de gauche, l'écart entre les deux droites reste sensiblement le même. Ainsi le modèle additif est le plus adapté.
Méthodologie Statistique de la décomposition
Ainsi les séries temporelles peuvent être décomposées en 3 composantes.
Dans le modèle additif, on commence par calculer la tendance. Elle peut être estimée de plusieurs manières via une méthode paramétrique (type calcul des moindres carrés). La courbe de tendance pourra suivant le modèle être :
linéaire : y = a t + b
quadratique / ordre 2 : y = a t² + b t + c
exponentielle : y = a exp(wt)
ARIMA : pour les séries non stationnaires
Pour la saisonnalité, l'objectif est de retrouver un schéma qui se répète sur une fréquence temporelle. Il faut retirer la composante tendancielle et distinguer la période de la saison et son motif.
Le bruit où le résidu est ce qu'il reste après le retrait des composantes tendancielles et saisonnières. Il est généralement estimé à un bruit blanc Gaussien.
Remarque : Pour un modèle multiplicatif, on peut se ramener à un modèle additif en prenant le logarithme népérien de la série temporelle et ainsi à sa décomposition précédente
On peut évaluer la part de chacune de ces composantes en calculant la variance de ces dernières et celle de la série temporelle. Mathématiquement, la variance explique l'écart d'une courbe à la moyenne. A partir de la variance de la série temporelle et celle de ses composantes, on peut calculer la proportion de la variance de chacune de ces composantes. Plus la part de la variance d'une composante est grande, plus elle va expliquer le phénomène. Ainsi, un marché avec une saisonnalité forte aura sa composante saisonnière avec une variance élevée.
Remarque : La somme des parts de la variance des trois composantes ne fait pas 100% (la somme des carrés n'est pas forcément égale au carré de la somme). Néanmoins elle peut être rebasée sur 100%.
Application de modèle prédictif
Lorsque les trois composantes d'une série temporelle sont identifiées, il est désormais possible de réaliser un modèle prédictif.
Les trois parties de la série temporelle sont déterminées, il est possible de la calculer en faisant défiler les jours (on calcule le modèle pour un jour après la date de fin).
Il est très important de bien réaliser la décomposition d'une série temporelle afin de réussir, par la suite, la prédiction la plus juste.