Prévision via Deep Learning (2018)

Dans le cadre de notre engagement fondamental à fournir les prévisions les plus précises que la technologie puisse produire, nous sommes fiers d’annoncer que notre 5ème génération de moteur de prévision est désormais en ligne chez Lokad. Ce moteur apporte la plus grande amélioration de précision que nous ayons jamais réussi à réaliser en une seule version.

De la prévision probabiliste au deep learning

La conception du moteur repose sur une saveur relativement récente d’apprentissage automatique appelée deep learning. Pour les chaînes d’approvisionnement, de grandes améliorations de précision de prévision peuvent se traduire par des retours tout aussi importants, en servant plus de clients, en les servant plus rapidement, tout en étant confronté à moins de risques de stocks. Il y a environ 18 mois, nous annoncions la 4ème génération de notre technologie de prévision. La 4ème génération a été la première à fournir de vraies prévisions probabilistes. Les prévisions probabilistes sont essentielles dans les chaînes d’approvisionnement car les coûts sont concentrés sur les extrêmes statistiques, lorsque la demande est inattendue. En revanche, les méthodes de prévision traditionnelles - comme les prévisions quotidiennes, hebdomadaires ou mensuelles traditionnelles - qui se concentrent uniquement sur la fourniture de prévisions médianes ou moyennes, sont aveugles au problème. En conséquence, ces méthodes échouent généralement à fournir des retours satisfaisants pour les entreprises. La 5ème génération ne renie pas ses origines ; elle embrasse également les prévisions probabilistes et s’appuie sur l’expérience acquise avec la génération précédente.

Par hasard en partie, il s’avère que le deep learning est fortement orienté vers les prévisions probabilistes par conception. La motivation pour cette perspective était cependant totalement sans rapport avec les préoccupations de la chaîne d’approvisionnement. Les algorithmes de deep learning favorisent l’optimisation basée sur une perspective probabiliste / bayésienne avec des métriques comme l’entropie croisée car ces métriques fournissent des valeurs de gradient énormes qui sont particulièrement adaptées à la descente de gradient stochastique, l’algorithme “un” qui rend le deep learning possible.

Dans le cas spécifique des chaînes d’approvisionnement, il se trouve que les fondements du deep learning sont parfaitement alignés avec les exigences commerciales réelles !

Au-delà du battage médiatique de l’intelligence artificielle

L’intelligence artificielle - alimentée par le deep learning en pratique - a été le mot à la mode de l’année 2017. Les affirmations sont audacieuses, enthousiasmantes et, eh bien, floues. Du point de vue de Lokad, nous observons que la majorité de ces technologies d’IA d’entreprise ne sont pas à la hauteur de leurs attentes. Très peu d’entreprises peuvent sécuriser plus d’un demi-milliard de dollars de financement, comme Instacart, pour rassembler une équipe de deep learning de classe mondiale afin de relever avec succès un défi de chaîne d’approvisionnement.

Avec cette version, Lokad rend la technologie de prévision de qualité IA accessible à toute entreprise raisonnablement “digitalisée”. Évidemment, le tout est toujours alimenté par des données historiques de la chaîne d’approvisionnement, donc les données doivent être accessibles à Lokad, mais notre technologie ne nécessite aucune expertise en deep learning. Contrairement à pratiquement toutes les technologies d’IA “d’entreprise”, Lokad ne repose pas sur l’ingénierie manuelle des caractéristiques. En ce qui concerne nos clients, la transition de nos prévisions probabilistes précédentes au deep learning se fera en toute transparence. Lokad est la première entreprise de logiciels à fournir une technologie de prévision de qualité IA clé en main, accessible aussi bien aux petites boutiques en ligne d’une personne qu’aux plus grands réseaux de chaîne d’approvisionnement pouvant inclure des milliers de sites et un million de références de produits.

L’ère du calcul GPU

Le deep learning est resté quelque peu de niche jusqu'à ce que la communauté parvienne à mettre à niveau son propre bloc de construction logiciel pour tirer parti des GPU (unités de traitement graphique). Ces GPU diffèrent largement des CPU (unités centrales de traitement), qui alimentent encore la grande majorité des applications de nos jours, à l'exception notable des jeux informatiques, qui reposent intensivement sur les deux CPU et GPU. En plus de la refonte complète de notre moteur de prévision pour cette 5e itération, nous avons également considérablement amélioré l'infrastructure de bas niveau de Lokad. En effet, pour servir les entreprises, la plateforme Lokad exploite désormais les GPU ainsi que les CPU. Lokad profite désormais des machines alimentées par GPU qui peuvent être louées sur Microsoft Azure, la plateforme de cloud computing qui prend en charge Lokad. Grâce à la puissance de traitement massive des GPU, nous rendons non seulement nos prévisions plus précises, mais nous les rendons également beaucoup plus rapides. Grâce à une grille de GPU, nous obtenons maintenant généralement les prévisions environ 3 à 6 fois plus rapidement, pour tout ensemble de données de taille importante (*).

(*) Pour les ensembles de données ultra-petits, notre moteur de prévision de 5e génération est en fait plus lent et prend quelques minutes de plus - ce qui est largement négligeable en pratique.

Lancement de produits et promotions

Notre moteur de prévision de 5e génération apporte des améliorations substantielles aux situations de prévision difficiles, notamment les lancements de produits et les promotions. De notre point de vue, les lancements de produits, bien que très difficiles, restent un peu plus faciles que les prévisions de promotions. La différence de difficulté est due à la qualité des données historiques, qui est invariablement inférieure pour les promotions par rapport aux lancements de produits. Les données de promotion s’améliorent avec le temps une fois que les processus appropriés d’assurance qualité sont en place.

En particulier, nous considérons le deep learning comme une énorme opportunité pour les marques de mode qui ont du mal avec les lancements de produits qui dominent leurs ventes : lancer un nouveau produit n’est pas l’exception, c’est la règle. Ensuite, alors que les variantes de couleur et de taille gonflent considérablement le nombre de SKUs, la situation devient encore plus complexe.

Notre FAQ sur les prévisions

Quels modèles de prévision utilisez-vous?

Notre moteur de prévision profonde utilise un seul modèle basé sur les principes du deep learning. Contrairement aux modèles statistiques classiques, c’est un modèle qui comporte des dizaines de millions de paramètres entraînables, soit environ 1000 fois plus de paramètres que notre modèle d’apprentissage automatique non profond le plus complexe précédent. Le deep learning surpasse de manière spectaculaire les anciennes approches d’apprentissage automatique (forêts aléatoires, arbres boostés par gradient). Cependant, il convient de noter que ces anciennes approches d’apprentissage automatique surpassaient déjà tous les classiques des séries temporelles (Box-Jenkins, ARIMA, Holt-Winters, lissage exponentiel, etc).

Apprenez-vous de vos erreurs de prévision?

Oui. Le processus de formation statistique - qui génère finalement le modèle de deep learning - exploite toutes les données historiques disponibles chez Lokad. Les données historiques sont exploitées à travers un processus appelé backtesting. Ainsi, plus il y a de données historiques disponibles pour le modèle, plus le modèle a d’opportunités pour apprendre de ses propres erreurs.

Votre moteur de prévision gère-t-il la saisonnalité, les tendances, les jours de la semaine?

Oui, le moteur de prévision gère toutes les cyclicités courantes, et même les quasi-cyclicités, dont l’importance est souvent sous-estimée. En ce qui concerne le code, le modèle de deep learning utilise intensivement une approche de séries temporelles multiples pour exploiter les cyclicités observées dans d’autres produits, afin d’améliorer la précision des prévisions de n’importe quel produit donné. Naturellement, deux produits peuvent partager la même saisonnalité, mais pas le même schéma de jours de la semaine. Le modèle est capable de capturer ce schéma. De plus, l’un des principaux avantages du deep learning est la capacité à capturer correctement la variabilité de la saisonnalité elle-même. En effet, une saison peut commencer plus tôt ou plus tard en fonction de variables externes, telles que la météo, et ces variations sont détectées et reflétées dans nos prévisions.

De quelles données avez-vous besoin?

Comme c’était le cas avec notre génération précédente de technologie de prévision, pour prévoir la demande, le moteur de prévision doit être fourni - au moins - avec la demande historique quotidienne, et fournir un historique des commandes désagrégé est encore mieux. En ce qui concerne la longueur de l’historique - plus il est long, mieux c’est. Alors qu’aucune saisonnalité ne peut être détectée avec moins de 2 ans d’historique, nous considérons 3 ans d’historique comme bon, et 5 ans excellent. Pour prévoir les délais de livraison, le moteur nécessite généralement que les bons de commande contiennent à la fois les dates de commande et les dates de livraison. Spécifier les attributs de votre produit ou SKU aide également à affiner considérablement les prévisions. De plus, fournir vos niveaux de stock nous est également très utile pour vous fournir une première analyse de stock significative.

Pouvez-vous prévoir mon fichier Excel?

En règle générale, si toutes vos données rentrent dans une feuille Excel, alors nous ne pouvons généralement pas faire grand-chose pour vous, et pour être honnête, personne ne le peut non plus. Les données de tableur sont susceptibles d’être agrégées par semaine ou par mois, et la plupart des informations historiques finissent par être perdues par le biais de cette agrégation. De plus, dans ce cas, votre feuille de calcul ne contiendra pas non plus beaucoup d’informations sur les catégories et les hiérarchies qui s’appliquent à vos produits. Notre moteur de prévision exploite toutes les données que vous avez, et effectuer un test sur un petit échantillon ne donnera pas de résultats satisfaisants.

Et les ruptures de stock et les promotions?

Les ruptures de stock et les promotions représentent tous deux un biais dans les ventes historiques. Comme l’objectif est de prévoir la demande, et non les ventes, ce biais doit être pris en compte. Une méthode fréquente - mais incorrecte - de traiter ces événements consiste à réécrire l’historique, pour combler les lacunes et tronquer les pics. Cependant, nous n’aimons pas cette approche, car elle consiste à fournir des prévisions au moteur de prévision, ce qui peut entraîner des problèmes de surajustement majeurs. Au lieu de cela, notre moteur prend en charge nativement des “drapeaux” qui indiquent où la demande a été censurée ou gonflée.

Prévoyez-vous les nouveaux produits?

Oui, nous le faisons. Cependant, pour prévoir les nouveaux produits, le moteur nécessite les dates de lancement des autres produits “plus anciens”, ainsi que leur demande historique au moment du lancement. De plus, il est conseillé de spécifier certaines de vos catégories de produits et/ou une hiérarchie de produits. Le moteur prévoit en effet les nouveaux produits en détectant automatiquement les produits “plus anciens”, qui peuvent être considérés comme comparables aux nouveaux. Cependant, comme aucune demande n’a encore été observée pour les nouveaux articles, les prévisions reposent entièrement sur les attributs qui leur sont associés.

Utilisez-vous des données externes pour affiner les prévisions?

Nous pouvons utiliser des données de tarification concurrentielle généralement obtenues auprès de sociétés tierces spécialisées dans le web scraping par exemple. Les données de trafic web peuvent également être utilisées, et éventuellement acquises, pour enrichir les données historiques afin d’améliorer encore davantage la précision statistique. En pratique, le plus grand obstacle à l’utilisation de sources de données externes n’est pas le moteur de prévision Lokad - qui est assez performant - mais la mise en place et le maintien d’un pipeline de données de haute qualité attaché à ces sources de données externes.