Les séries temporelles sont l’un des outils mathématiques les plus basiques et polyvalents utilisés dans le domaine de l’entreprise. Tout simplement, une série temporelle est une série de points de données indexés dans le temps. Ainsi, une série temporelle peut modéliser n’importe quoi, de l’évolution des ventes d’une entreprise à celle des prix de leurs produits, sur une base annuelle, mensuelle, quotidienne, voire horaire. Les séries temporelles sont particulièrement intuitives, ce qui les rend idéales pour décrire, visualiser, modéliser et enfin prévoir un certain nombre de variables.
Statistiques descriptives avec les séries temporelles
L’utilisation principale des séries temporelles est descriptive. Les séries temporelles peuvent condenser une grande quantité d’informations dans un seul graphique ou tableau. Cependant, comme les séries temporelles sont particulièrement intuitives, les gens peuvent facilement les simplifier à l’excès ou les interpréter de manière erronée. Une source de mauvaise interprétation est l’agrégat temporel utilisé par la série temporelle. Les mois de notre calendrier sont une façon quelque peu arbitraire de découper le temps et il ne faut pas se faire d’illusion sur le fait que nos mois sont homogènes d’un point de vue commercial. Des nombres inégaux de jours et de week-ends dans un mois peuvent expliquer ce qui pourrait apparaître comme des divergences dans les données. D’autres phénomènes expliquent la cyclicité dans les variations des données. Par exemple, les jours fériés tels que Noël ou le Black Friday entraînent systématiquement des pics de ventes, tout comme les jours de paie en début de mois. Cependant, cette cyclicité ne correspond pas nécessairement à notre calendrier. Des traditions comme le Ramadan ou le Nouvel An chinois entraînent des variations cycliques des données, bien que le cycle ne soit pas mensuel ou annuel. De plus, il faut se méfier de tirer des conclusions hâtives à partir de séries temporelles ou d’établir des corrélations trop simples entre les graphiques. Il est donc important de garder à l’esprit ce qui distingue une variable de l’autre (ventes de la demande ou des bénéfices).
Visualisation des séries temporelles
Les séries temporelles sont également souvent utilisées pour lire et visualiser des données, ainsi que pour comparer différentes séries. Une fois de plus, cependant, les pièges de ces graphiques résident dans leur apparente simplicité. Différentes techniques de représentation peuvent donc être utilisées pour fournir la meilleure visualisation possible des données. Par exemple, relier les points de données par des lignes donne une impression de continuité. Cela peut être utile lors de la représentation de l’évolution horaire des prix des actions, par exemple.
Cependant, dans le cas de données particulièrement discontinues, un graphique en barres peut être plus approprié.
Lors de la lecture d’une série temporelle, il faut également prêter une attention particulière à l’axe des abscisses. Certains graphiques se concentrent sur de petits intervalles de valeurs afin de mettre en évidence les variations des données, avec le risque que ces variations soient surestimées. D’autres phénomènes, tels que la croissance exponentielle, sont également mal représentés par une échelle linéaire sur l’axe des abscisses. On peut donc choisir d’utiliser une échelle logarithmique où les premiers stades de la croissance peuvent être perçus aussi bien que les derniers.
Modélisation et prévision
Les séries temporelles sont fréquemment utilisées pour soutenir des modèles statistiques. L’objectif de ces modèles est double : expliquer le passé et prédire l’avenir. En supply chain, prédire la demande future est nécessaire pour déterminer les commandes d’achat et de production et minimiser les risques de surstocks. Il est courant de distinguer, au sein d’une série temporelle, un niveau primaire appelé la ligne de base, une évolution à long terme appelée la tendance, des variations cycliques ou périodiques appelées saisonnalité, et d’autres variations aléatoires que nous appelons bruit. Cela nous permet de distinguer les variations des données liées à des cycles réguliers, d’une tendance sous-jacente à la baisse ou à la hausse. Ces modèles servent de base aux prévisions économiques.
Il existe trois principaux types de prévisions, qui ont chacun des objectifs différents.
- Les prévisions ponctuelles visent à donner la “meilleure” valeur future d’une variable selon une métrique d’erreur spécifiée. C’est le cas, par exemple, d’une prévision météorologique qui prédit une seule valeur de température pour chaque jour. Une prévision ponctuelle n’a pas pour but de représenter fidèlement l’évolution de cette variable (le lecteur sait très bien que la température est susceptible de varier autour de sa valeur prédite), mais sert d’indication utile pour le lecteur et de base solide pour ses choix futurs.
- Les prévisions probabilistes fournissent les distributions de probabilité complètes de la valeur future. Les intervalles de confiance sont fréquemment utilisés pour visualiser de telles prévisions. De telles prévisions peuvent par exemple être utiles à des fins spéculatives.
- Les prévisions génératives rendent l’évolution de la variable “naturelle” ou “plausible”, permettant une certaine quantité de contingence et d’évolution aléatoire. Cette “perspective générative” peut être utile lors de l’exécution de simulations.
L’écosystème logiciel autour des séries temporelles
De nombreux types de logiciels sont désormais utilisés afin de prendre en compte les complexités liées aux séries temporelles et de fournir des modèles ou des prévisions qui répondent au mieux aux besoins de leurs utilisateurs. On peut trouver des bases de données, des outils open-source, et même des langages de programmation entièrement dédiés aux séries temporelles. De nombreuses méthodes de prévision ont également été développées. Par exemple, certains logiciels estiment simplement les valeurs futures avec une moyenne mobile, tandis que d’autres types de logiciels optent pour un lissage exponentiel, ce qui signifie que le poids des valeurs passées diminue de manière exponentielle à mesure que ces valeurs s’éloignent dans le temps.
Les séries temporelles sont donc une abstraction particulièrement polyvalente et un outil statistique de base. Cependant, leur apparente simplicité peut être trompeuse. Un certain nombre de facteurs peuvent altérer la façon dont les données sont présentées ou expliquer des variations importantes dans les données. Il est donc essentiel de savoir comment les données sont collectées et d’être conscient des facteurs mentionnés ci-dessus.