En statistiques, la précision de la prévision est le degré de proximité de l’énoncé de la quantité à la valeur réelle (vraie) de cette quantité. La valeur réelle ne peut généralement pas être mesurée au moment de la prévision car l’énoncé concerne l’avenir. Pour la plupart des entreprises, des prévisions plus précises augmentent leur efficacité à servir la demande tout en réduisant les coûts opérationnels globaux.
Utilisation des estimations de précision
La précision, lorsqu’elle est calculée, fournit une estimation quantitative de la qualité attendue des prévisions. Pour l’optimisation des stocks, l’estimation de la précision des prévisions peut servir à plusieurs fins :
- choisir parmi plusieurs modèles de prévision qui servent à estimer la demande principale quel modèle devrait être privilégié.
- calculer les stocks de sécurité en supposant généralement que les erreurs de prévision suivent une distribution normale.
- hiérarchiser les articles qui nécessitent le plus d’attention particulière car les prévisions statistiques brutes ne sont pas suffisamment fiables.
Dans d’autres contextes, tels que la planification stratégique, les estimations de précision sont utilisées pour soutenir l’analyse des scénarios, en tenant compte de scénarios distincts et de leur probabilité respective.
Impact de l’agrégation sur la précision
Il est courant de penser à tort que la qualité du modèle de prévision est le principal facteur déterminant la précision des prévisions : ce n’est pas le cas.
Le facteur le plus important déterminant la valeur de la précision est la volatilité intrinsèque du phénomène prévu. En pratique, dans le commerce ou la fabrication, cette volatilité est fortement corrélée au niveau d’agrégation :
- des zones plus grandes, telles que les prévisions nationales par rapport aux prévisions locales, donnent une plus grande précision.
- idem pour des périodes plus longues, telles que les prévisions mensuelles par rapport aux prévisions quotidiennes.
Ensuite, une fois qu’un niveau d’agrégation est donné, la qualité du modèle de prévision joue en effet un rôle primordial dans la précision qui peut être atteinte. Enfin, la précision diminue lorsque l’on regarde plus loin dans le futur.
Précision empirique vs précision réelle
Le terme précision est le plus souvent utilisé pour désigner la qualité d’une mesure physique quelconque. Malheureusement, cette vision est quelque peu trompeuse lorsqu’il s’agit de prévisions statistiques. En effet, contrairement à la configuration physique où la mesure pourrait être comparée à des méthodes alternatives, la précision réelle de la prévision doit être strictement mesurée par rapport aux données que vous n’avez pas.
En effet, une fois que les données sont disponibles, il est toujours possible de produire des prévisions parfaitement précises, car cela ne nécessite que de reproduire les données. Cette question unique a laissé les statisticiens perplexes pendant plus d’un siècle, jusqu’à ce qu’un point de vue profondément satisfaisant soit trouvé à la fin du XXe siècle avec l’avènement de la théorie de Vapnik-Chervonenkis1.
La précision des prévisions ne peut être pratiquement mesurée qu’en fonction des données disponibles ; cependant, lorsque les données sont disponibles, ces prévisions ne sont plus de véritables prévisions, car elles sont des déclarations sur le passé plutôt que sur l’avenir. Ainsi, ces mesures sont appelées précision empirique, par opposition à la précision réelle.
Les problèmes de surapprentissage peuvent entraîner de grandes divergences entre la précision empirique et la précision réelle. En pratique, une utilisation prudente du backtesting peut atténuer la plupart des problèmes de surapprentissage lors de la prévision de séries temporelles.
Métriques de précision populaires
Il existe de nombreuses métriques pour mesurer la précision des prévisions. Les métriques les plus largement utilisées sont :
- MAE (erreur absolue moyenne)
- MAPE (erreur absolue moyenne en pourcentage)
- MSE (erreur quadratique moyenne)
- sMAPE (erreur absolue moyenne symétrique en pourcentage)
- Perte de flippeur (une généralisation de la MAE pour les prévisions de quantiles)
- CRPS (une généralisation de la MAE pour les prévisions probabilistes)
En pratique, une métrique devrait être privilégiée par rapport à une autre en fonction de sa capacité à refléter les coûts encourus par l’entreprise en raison des inexactitudes des prévisions.
Attention chez Lokad
Il vaut mieux être approximativement correct que complètement faux. Dans notre expérience avec les entreprises commerciales ou manufacturières, nous constatons régulièrement que trop peu d’attention est accordée au choix de la métrique de précision.
En effet, la métrique idéale ne devrait pas renvoyer des valeurs exprimées en pourcentage, mais devrait renvoyer des dollars ou des euros, reflétant précisément le coût des inefficacités causées par les prévisions inexactes. En particulier, bien que la plupart des métriques populaires soient symétriques (la perte de flippeur étant une exception notable), les risques de surprévision par rapport à la sous-prévision ne sont pas symétriques en pratique. Nous suggérons d’adopter un point de vue où la métrique se rapproche d’une fonction de coût économique - soigneusement modélisée pour s’adapter aux contraintes de l’entreprise - plutôt que d’un simple indicateur statistique brut.
De plus, il est très important de ne pas effectuer de planification en supposant implicitement que les prévisions sont exactes. L’incertitude est inévitable en affaires et doit être prise en compte.
Pour aller plus loin
- Vidéo. Précision dans les prévisions de vente, Matthias Steinberg, septembre 2011
- La meilleure métrique d’erreur de prévision, Joannes Vermorel, novembre 2012
- Impact financier de la précision sur les stocks, Joannes Vermorel, février 2012
Notes
-
Wikipedia. Théorie de Vapnik-Chervonenkis ↩︎