Prévisions classiques de séries temporelles (2008)

Cette page présente une FAQ (Foire Aux Questions) pour notre technologie de prévision classique. En pratique, les prévisions classiques sont largement surpassées par les prévisions probabilistes. Consultez nos dernières pages de technologie pour plus d’informations.

Les bases

Quels modèles de prévision utilisez-vous?

Répondre à cette question est délicat pour deux raisons : premièrement, notre technologie de prévision est un actif de propriété intellectuelle (PI) essentiel que nous ne sommes pas prêts à divulguer en détail ; deuxièmement, notre technologie est complexe et comporte de nombreux modèles. Cela dit, Lokad exploite une théorie bien connue appelée la théorie de l’apprentissage statistique. Cette théorie englobe la plupart des méthodes modernes de prévision telles que la régression par vecteur de support, les réseaux bayésiens, les méthodes de mélange ou de renforcement et les méta-heuristiques incluant les réseaux neuronaux ou les algorithmes génétiques… Ensuite, nous n’écartons pas non plus les classiques : autorégression linéaire, moyenne mobile, lissage exponentiel (double, triple), Box-Jenkins, Holt-Winters, ARMA, ARIMA. Cependant, ces classiques sont généralement très faibles lorsqu’il s’agit d’exploiter les corrélations entre les séries temporelles.

Quelle est la précision de vos prévisions?

La précision des prévisions dépend énormément de l’ensemble de données spécifique considéré. Nous avons rencontré des situations où une erreur de 0,5 % était considérée comme médiocre (comme les prévisions horaires de la consommation nationale d’électricité 24h à l’avance), et d’autres situations où une erreur de 80 % était considérée comme excellente (comme une opération promotionnelle unique réalisée lors du lancement d’un produit). La précision dépend fortement de l’horizon - plus les prévisions sont éloignées, moins elles sont précises -, mais la précision dépend également fortement du niveau d’agrégation - plus les prévisions sont agrégées, plus elles sont précises.

Compétitions de prévisions, avez-vous une validation académique de votre technologie?

Il existe de nombreuses compétitions de fouille de données qui ont lieu chaque année. Chez Lokad, nous gardons généralement un œil sur ces événements, et nous comparons régulièrement notre technologie de prévision à ces ensembles de données de compétition lorsque les données sont pertinentes pour Lokad (nous ne traitons que des séries temporelles, pas des images ou des profils de clients par exemple). Bien que, à ce jour, nous n’ayons pas encore observé de compétition publique de fouille de données que nous considérons comme profondément représentative des défis auxquels nous sommes confrontés quotidiennement. Tout d’abord, les ensembles de données académiques tendent à être petits - moins de quelques centaines de séries temporelles - avec des séries temporelles longues - des centaines de points de données par série temporelle. C’est presque l’opposé de ce que nous observons généralement dans le commerce de détail : des milliers, voire des millions de séries temporelles, mais des séries très courtes car les produits ont une durée de vie courte. Cela dit, Lokad se débrouille généralement bien dans ces compétitions, et très bien si l’on prend en compte que, avec Lokad, les résultats sont obtenus immédiatement, aucune expertise n’est requise pour produire les résultats.

Évaluez-vous la précision de vos prévisions?

Oui, nous le faisons. Des mesures quantitatives précises de la précision des prévisions obtenues avec notre technologie de prévision représentent environ la moitié de notre technologie de base. Sans entrer dans les détails, disons que c’est un grand défi, non seulement de produire des modèles qui correspondent réellement à vos données, mais qui se révèlent également très bons sur les données que vous n’avez pas encore, c’est-à-dire les données futures. Voir aussi Surapprentissage: quand la mesure de précision fait fausse route. La tâche quotidienne typique de l’équipe R&D de Lokad consiste à exécuter encore et encore notre moteur de prévision sur les ensembles de données des clients, mesurer les erreurs de prévision et essayer de les réduire. Ensuite, un aspect remarquable de notre technologie est que vous n’obtenez pas seulement des prévisions, mais aussi, pour chaque valeur prévue, vous obtenez la précision attendue de cette valeur, exprimée sous forme d’une erreur MAPE. Ainsi, vous n’avez pas à attendre pour découvrir enfin qu’une prévision était peu fiable, Lokad vous donne l’information à l’avance pour que vous ajustiez votre stratégie en conséquence.

De combien de données historiques avez-vous besoin?

Il n’y a pas d’exigence minimale pour la quantité de données historiques. Cela dit, Lokad fournit une technologie statistique, donc plus il y a de données historiques, plus les prévisions sont précises. En pratique, 2 ans de données historiques sont considérés comme bons, et 3 ans ou plus sont considérés comme excellents. Si vous avez moins d'1 an de données historiques, alors Lokad ne pourra pas affiner les prévisions à travers la saisonnalité qui est un motif important pour de nombreuses entreprises. De plus, pour exploiter la saisonnalité, Lokad n’a pas besoin de plus d'1 an sur chaque série temporelle individuelle (c’est-à-dire les ventes de produits), nous avons seulement besoin d’avoir quelques séries temporelles avec plus d'1 an d’historique pour établir les profils de saisonnalité qui existent dans votre entreprise. Pour les startups et les entreprises émergentes, Lokad peut être utilisé dès le début. En effet, nous fournissons non seulement des prévisions mais aussi la précision attendue des prévisions. Ainsi, les premières prévisions ont généralement des niveaux d’erreur très élevés et s’améliorent progressivement avec le temps. Lokad vous offre un moyen de quantifier l’incertitude également.

Modèles généraux

Tendances macro (par exemple: crise financière), comment sont-elles gérées?

Nous pensons qu’il y a deux malentendus typiques concernant les tendances macro. Tout d’abord, les tendances macro ne peuvent être exploitées pour affiner les prévisions de la demande que si ces tendances macro peuvent elles-mêmes être prévues avec précision. Si les banques avaient pu prévoir la crise financière, il n’y aurait pas eu de crise en premier lieu. Prévoir les tendances macro est généralement beaucoup plus difficile que de prévoir la demande pour votre produit moyen, c’est donc souvent une option plutôt inextricable. Deuxièmement, une récession à -3% / an est considérée comme une grande tendance macro, mais en pratique cela signifie un impact de -0,06% au niveau hebdomadaire. En comparaison, nous observons régulièrement des variations des ventes de produits de 20% d’une semaine à l’autre. Lokad est le mieux adapté pour les prévisions à court terme, et en regardant quelques semaines à l’avance, les tendances macro sont généralement éclipsées par des facteurs microéconomiques tels que les promotions, la cannibalisation, les campagnes publicitaires, … En conclusion, Lokad ignore généralement la plupart des tendances macro, mais à notre expérience, c’est la seule option raisonnable pour 99% des situations.

Saisonnalité, tendance, comment sont-elles gérées?

Nous détectons automatiquement les motifs basés sur le calendrier. Vous n’avez pas besoin d’indiquer à Lokad qu’un produit est saisonnier, la saisonnalité est un motif fréquent traité nativement par notre technologie de prévision. En fait, la saisonnalité est beaucoup plus complexe que ce que la plupart des gens pensent. À nos yeux, il n’y a pas une seule saisonnalité mais de nombreux motifs cycliques qui interagissent de multiples façons. Il y a la saisonnalité annuelle, l’effet du jour de la semaine, l’effet du chèque de paie au niveau mensuel, la saisonnalité quasi-annuelle comme la fête des mères célébrée le 2ème dimanche de mai aux États-Unis, … De plus, lors de la prévision des ventes au niveau du point de vente, les motifs cycliques des produits se combinent avec les motifs cycliques du point de vente lui-même. En effet, chaque point de vente a un environnement plus ou moins unique qui génère ses propres motifs de demande. Ainsi, la saisonnalité ne se résume pas à fournir un simple indicateur OUI/NON, c’est un ensemble de motifs interdépendants plutôt complexes. La bonne nouvelle est que Lokad gère cette complexité pour vous.

Pâques, Ramadan, la fête des mères et autres événements quasi-saisonniers?

Certains motifs calendaires sont, dans le jargon de Lokad, quasi-saisonniers : les motifs se répètent d’une année à l’autre, mais ils ne sont pas strictement annuels au sens du calendrier grégorien (également connu sous le nom de calendrier occidental ou chrétien). Pâques, Ramadan, le Nouvel An chinois, la fête des mères sont autant d’exemples de motifs quasi-saisonniers. Lokad détecte automatiquement les motifs quasi-saisonniers, vous n’avez donc pas besoin de consacrer d’effort spécifique pour gérer ces motifs. Ensuite, de manière très similaire à la saisonnalité classique, Lokad s’appuie principalement sur l’analyse de multiples séries temporelles pour détecter les séries temporelles qui présentent des motifs quasi-saisonniers similaires afin de affiner l’analyse des motifs.

Cycles de vie des produits et lancements de produits, comment sont-ils gérés?

La plupart des biens de consommation suivent un cycle de vie. Les produits sont lancés, croissent, déclinent et finalement sont retirés du marché. Lokad peut prévoir les ventes au lancement, en considérant que la date de lancement est donnée. Évidemment, lorsqu’un produit est sur le point d’être lancé, il n’y a pas de données de vente disponibles pour ce produit même pour étayer la prévision. Cependant, contrairement aux outils de prévision classiques, Lokad ne se limite pas à la simple prévision de séries temporelles. En particulier, les produits peuvent être décrits par des tags. Un tag peut représenter à peu près n’importe quelle propriété du produit : catégorie, sous-catégorie, famille, marque, couleur, taille, … Pour prévoir les ventes d’un produit en cours de lancement, Lokad analyse les lancements historiques de produits similaires, et les similitudes sont évaluées en fonction des tags fournis pour chaque produit. Nous appliquons le même principe pour d’autres motifs de cycle de vie.

Produits intermittents / à faible volume, comment sont-ils gérés?

Si vous avez un produit qui est vendu une fois par an, eh bien, il y a peu de choses à faire en ce qui concerne la prévision statistique. En pratique, c’est plutôt un choix marketing d’avoir 1 unité en stock ou zéro. Cependant, entre ce cas extrême de produit à rotation lente et vos meilleures ventes, il y a toute une zone grise de produits vendus de manière intermittente mais assez fréquemment pour nécessiter une optimisation des stocks. La plupart des outils de prévision classiques se comportent mal face aux ventes intermittentes. Chez Lokad, nous avons beaucoup travaillé sur ce motif de demande car de nombreuses entreprises, telles que le commerce électronique, dépendent fortement de la longue traîne pour atteindre la rentabilité. Cependant, les produits à rotation lente, sauf s’ils sont gérés avec soin, peuvent générer encore plus de stocks que les meilleures ventes. Pour faire face aux produits à rotation lente, nous vous suggérons d’opter pour les prévisions probabilistes.

Météo, comment est-elle gérée?

Dans certaines entreprises, telles que les épiceries, la météo est un facteur de demande très important. À ce jour, Lokad n’utilise pas les prévisions météorologiques comme entrée dans notre technologie de prévision. Cependant, cet élément fait partie de notre feuille de route à moyen terme. Notre objectif n’est pas seulement de prendre en charge les entrées météorologiques, mais de rendre le processus largement automatisé, de sorte qu’il ne nécessite pratiquement aucun effort de la part de nos clients pour bénéficier de la précision supplémentaire.

Artefacts de demande

Ventes perdues dues aux ruptures de stock, comment sont-elles gérées?

Les ventes ne correspondent pas à la demande. Une rupture de stock est un artefact qui déforme les ventes par rapport à la demande initiale. En effet, une rupture de stock entraîne une baisse des ventes alors que la demande reste stable. Contrairement aux outils de prévision classiques, avec Lokad, vous n’avez pas besoin de modifier ou d’ajuster vos données historiques pour exprimer les ventes qui auraient eu lieu si aucune rupture de stock n’avait eu lieu. Au lieu de cela, les événements peuvent être utilisés pour indiquer quand les ruptures de stock ont eu lieu. Les informations sur les ruptures de stock sont utilisées pour estimer de manière plus précise tous les motifs qui auraient été impactés (saisonnalité, tendance, …) autrement. Si les ruptures de stock ne sont pas signalées comme telles avec des événements, Lokad filtre ces motifs comme du bruit. Suivre les ruptures de stock est un plus, mais ce n’est pas une condition préalable pour commencer avec Lokad.

Ventes exceptionnelles, comment sont-elles gérées?

Selon votre secteur d’activité, votre entreprise peut être confrontée à des ventes exceptionnelles. Comme ces ventes sont, eh bien, exceptionnelles par leur taille, elles sont généralement assez faciles à repérer avec une approche purement statistique. Nous vous suggérons donc de ne pas modifier vos données historiques pour nettoyer ces ventes exceptionnelles. Premièrement, c’est probablement une perte de temps, deuxièmement, les ventes exceptionnelles elles-mêmes peuvent contenir des informations précieuses qui aident à prévoir la demande. Ensuite, Lokad ne peut pas prévoir les ventes exceptionnelles futures individuelles - qui peuvent dépendre du résultat d’une négociation par exemple. S’il y a des ventes exceptionnelles connues à venir, nous vous suggérons de remplacer manuellement les prévisions de Lokad avec cette information supplémentaire.

Agrégation, top-down ou bottom-up?

Certaines entreprises prévoient la demande au niveau des groupes ou des familles, puis divisent ces prévisions pour atteindre les produits individuels. C’est une méthode de prévision descendante par produit. La même idée peut être appliquée pour prévoir la fréquence : certaines entreprises prévoient d’abord au niveau hebdomadaire, puis appliquent des coefficients jour de la semaine. Dans ce cas, il s’agit d’une méthode de prévision descendante par fréquence. Dans l’autre sens, les prévisions hebdomadaires peuvent être produites en additionnant les prévisions quotidiennes. Chez Lokad, nous vous suggérons d’ajuster vos prévisions pour correspondre le plus étroitement possible à vos besoins opérationnels : si la supply chain a besoin de prévisions hebdomadaires pour chaque produit, demandez des prévisions hebdomadaires pour chaque produit à Lokad. Demander des prévisions quotidiennes et les additionner ne améliorera pas votre précision. En suivant la même idée, laisser Lokad prévoir les ventes au niveau du groupe de produits, puis diviser manuellement les prévisions pour chaque SKU est une mauvaise idée, car une erreur de prévision significative est susceptible d’être introduite par la division elle-même. En interne, Lokad s’appuie sur de nombreux algorithmes d’agrégation/désagrégation, et nous aimons généralement exploiter les données les plus détaillées disponibles. Par exemple, nous exploitons les données de ventes quotidiennes pour fournir des prévisions mensuelles. En effet, un mois peut comporter 4 ou 5 week-ends qui ont un impact significatif sur la plupart des entreprises de vente au détail. Comme d’habitude, vous n’avez pas à vous soucier du niveau d’agrégation, Lokad gère vos besoins.