Prévision via le Deep Learning (2018)

Dans le cadre de notre engagement fondamental à fournir les prévisions les plus précises que la technologie puisse produire, nous sommes fiers d’annoncer que notre 5ème génération de moteur de prévision est maintenant disponible chez Lokad. Ce moteur apporte la plus grande amélioration de précision que nous ayons jamais réussi à réaliser en une seule version.

De la prévision probabiliste au deep learning

power-clouds
La conception du moteur repose sur une forme relativement récente d’apprentissage automatique appelée deep learning. Pour les chaînes d’approvisionnement, de grandes améliorations de précision de prévision peuvent se traduire par des rendements tout aussi importants, en servant plus de clients, en les servant plus rapidement, tout en réduisant les risques de stocks. Il y a environ 18 mois, nous annoncions la 4ème génération de notre technologie de prévision. La 4ème génération a été la première à fournir de véritables prévisions probabilistes. Les prévisions probabilistes sont essentielles dans les chaînes d’approvisionnement car les coûts sont concentrés sur les extrêmes statistiques, lorsque la demande est inattendue et élevée ou faible. En revanche, les méthodes de prévision traditionnelles - comme les prévisions quotidiennes, hebdomadaires ou mensuelles traditionnelles - qui se concentrent uniquement sur la fourniture de prévisions médianes ou moyennes, sont aveugles au problème. En conséquence, ces méthodes échouent généralement à fournir des rendements satisfaisants pour les entreprises. La 5ème génération ne renie pas ses origines ; elle intègre également des prévisions probabilistes et s’appuie sur l’expérience acquise avec la génération précédente.

Par hasard, il se trouve que le deep learning est particulièrement adapté aux prévisions probabilistes par conception. La motivation de cette perspective était cependant totalement indépendante des préoccupations de la chaîne d’approvisionnement. Les algorithmes de deep learning favorisent l’optimisation basée sur une perspective probabiliste / bayésienne avec des métriques telles que l’entropie croisée, car ces métriques fournissent des valeurs de gradient énormes qui conviennent particulièrement à la descente de gradient stochastique, l’algorithme “un” qui rend le deep learning possible.

Dans le cas spécifique des chaînes d’approvisionnement, il se trouve que les fondements du deep learning sont parfaitement alignés sur les exigences commerciales réelles !

Au-delà du battage médiatique de l’intelligence artificielle

L’intelligence artificielle - alimentée par le deep learning en pratique - a été le mot à la mode de l’année 2017. Les revendications sont audacieuses, enthousiasmantes et, eh bien, floues. Du point de vue de Lokad, nous constatons que la majorité de ces technologies d’IA d’entreprise ne sont pas à la hauteur de leurs attentes. Très peu d’entreprises peuvent obtenir plus d’un demi-milliard de dollars de financement, comme Instacart, pour constituer une équipe de deep learning de classe mondiale afin de relever avec succès un défi de chaîne d’approvisionnement.

Avec cette version, Lokad rend la technologie de prévision de qualité IA accessible à toute entreprise raisonnablement “digitalisée”. Évidemment, tout cela est toujours alimenté par des données historiques de la chaîne d’approvisionnement, donc les données doivent être accessibles à Lokad, mais notre technologie ne nécessite aucune expertise en deep learning. Contrairement à pratiquement toutes les technologies d’IA “d’entreprise”, Lokad ne repose pas sur l’ingénierie manuelle des caractéristiques. En ce qui concerne nos clients, la transition de nos prévisions probabilistes précédentes au deep learning se fera en toute transparence. Lokad est la première entreprise de logiciels à fournir une technologie de prévision de qualité IA clé en main, accessible aussi bien aux petites entreprises de commerce électronique qu’aux plus grands réseaux de chaîne d’approvisionnement pouvant inclure des milliers de sites et un million de références de produits.

L’ère du calcul GPU

power-clouds Le deep learning est resté quelque peu de niche jusqu'à ce que la communauté parvienne à mettre à niveau son propre bloc de construction logiciel pour tirer parti des GPU (unités de traitement graphique). Ces GPU diffèrent largement des CPU (unités centrales de traitement), qui alimentent encore la grande majorité des applications de nos jours, à l'exception notable des jeux informatiques, qui reposent intensivement à la fois sur les CPU et les GPU. En plus de la réécriture complète de notre moteur de prévision pour cette 5e itération, nous avons également considérablement amélioré l'infrastructure de bas niveau de Lokad. En effet, pour servir les entreprises, la plateforme Lokad exploite désormais les GPU ainsi que les CPU. Lokad tire désormais parti des machines alimentées par GPU qui peuvent être louées sur Microsoft Azure, la plateforme de cloud computing qui prend en charge Lokad. Grâce à la puissance de traitement massive des GPU, nous rendons non seulement nos prévisions plus précises, mais aussi beaucoup plus rapides. Grâce à une grille de GPU, nous obtenons maintenant les prévisions environ 3 à 6 fois plus rapidement, pour tous les ensembles de données de taille importante (*).

(*) Pour les ensembles de données ultra-petits, notre moteur de prévision de 5e génération est en réalité plus lent et prend quelques minutes de plus - ce qui est largement insignifiant en pratique.

Lancement de produits et promotions

Notre moteur de prévision de 5e génération apporte des améliorations substantielles aux situations de prévision difficiles, notamment les lancements de produits et les promotions. De notre point de vue, les lancements de produits, bien que très difficiles, restent un peu plus faciles que les prévisions de promotions. La différence de difficulté est due à la qualité des données historiques, qui est invariablement inférieure pour les promotions par rapport aux lancements de produits. Les données de promotion s’améliorent avec le temps une fois que les processus appropriés d’assurance qualité sont en place.

En particulier, nous considérons le deep learning comme une opportunité massive pour les marques de mode qui ont du mal avec les lancements de produits qui dominent leurs ventes : le lancement d’un nouveau produit n’est pas l’exception, c’est la règle. Ensuite, à mesure que les variantes de couleur et de taille gonflent considérablement le nombre de références de produits, la situation devient encore plus complexe.

Notre FAQ sur les prévisions

Quels modèles de prévision utilisez-vous ?

Notre moteur de prévision avancé utilise un modèle unique basé sur les principes du deep learning. Contrairement aux modèles statistiques classiques, il s’agit d’un modèle qui comporte des dizaines de millions de paramètres entraînables, soit environ 1000 fois plus de paramètres que notre modèle d’apprentissage automatique non deep learning le plus complexe précédent. Le deep learning surpasse largement les anciennes approches d’apprentissage automatique (forêts aléatoires, arbres boostés par gradient). Cependant, il convient de noter que ces anciennes approches d’apprentissage automatique surpassaient déjà tous les classiques des séries temporelles (Box-Jenkins, ARIMA, Holt-Winters, lissage exponentiel, etc).

Apprenez-vous de vos erreurs de prévision ?

Oui. Le processus de formation statistique - qui génère finalement le modèle de deep learning - exploite toutes les données historiques disponibles chez Lokad. Les données historiques sont exploitées grâce à un processus appelé backtesting. Ainsi, plus il y a de données historiques disponibles pour le modèle, plus le modèle a d’opportunités pour apprendre de ses propres erreurs.

Votre moteur de prévision gère-t-il la saisonnalité, les tendances, les jours de la semaine ?

Oui, le moteur de prévision gère toutes les cyclicités courantes, et même les quasi-cyclicités, dont l’importance est souvent sous-estimée. En ce qui concerne le code, le modèle de deep learning utilise intensivement une approche de séries temporelles multiples pour exploiter les cyclicités observées dans d’autres produits, afin d’améliorer la précision des prévisions pour un produit donné. Naturellement, deux produits peuvent partager la même saisonnalité, mais pas le même modèle de jours de la semaine. Le modèle est capable de capturer ce modèle. De plus, l’un des principaux avantages du deep learning est la capacité à capturer correctement la variabilité de la saisonnalité elle-même. En effet, une saison peut commencer plus tôt ou plus tard en fonction de variables externes, telles que la météo, et ces variations sont détectées et reflétées dans nos prévisions.

Quelles données avez-vous besoin ?

Comme c’était le cas avec notre génération précédente de technologie de prévision, pour prévoir la demande, le moteur de prévision doit être fourni - au moins - avec les données historiques de la demande quotidienne, et fournir un historique des commandes désagrégé est encore mieux. En ce qui concerne la longueur de l’historique - plus il est long, mieux c’est. Bien qu’aucune saisonnalité ne puisse être détectée avec moins de 2 ans d’historique, nous considérons que 3 ans d’historique sont bons et 5 ans excellents. Pour prévoir les délais de livraison, le moteur nécessite généralement que les bons de commande contiennent à la fois les dates de commande et les dates de livraison. Spécifier les attributs de votre produit ou SKU contribue également à affiner considérablement les prévisions. De plus, fournir vos niveaux de stock nous est également très utile pour vous fournir une première analyse de stock significative.

Pouvez-vous prévoir mon fichier Excel ?

En règle générale, si toutes vos données rentrent dans une seule feuille Excel, alors nous ne pouvons généralement pas faire grand-chose pour vous, et pour être honnête, personne ne le peut non plus. Les données de feuille de calcul sont susceptibles d’être agrégées par semaine ou par mois, et la plupart des informations historiques sont perdues par le biais de cette agrégation. De plus, dans ce cas, votre feuille de calcul ne contiendra pas non plus beaucoup d’informations sur les catégories et les hiérarchies qui s’appliquent à vos produits. Notre moteur de prévision exploite toutes les données dont vous disposez, et effectuer un test sur un petit échantillon ne donnera pas de résultats satisfaisants.

Qu’en est-il des ruptures de stock et des promotions ?

Les ruptures de stock et les promotions représentent un biais dans les ventes historiques. Étant donné que l’objectif est de prévoir la demande, et non les ventes, ce biais doit être pris en compte. Une façon fréquente - mais incorrecte - de traiter ces événements consiste à réécrire l’historique, pour combler les lacunes et tronquer les pics. Cependant, nous n’aimons pas cette approche, car elle consiste à fournir des prévisions au moteur de prévision, ce qui peut entraîner des problèmes de surajustement majeurs. Au lieu de cela, notre moteur prend en charge nativement des “drapeaux” qui indiquent où la demande a été censurée ou gonflée.

Prévoyez-vous les nouveaux produits ?

Oui, nous le faisons. Cependant, pour prévoir les nouveaux produits, le moteur nécessite les dates de lancement des autres produits “plus anciens”, ainsi que leur demande historique au moment du lancement. Il est également conseillé de spécifier certaines de vos catégories de produits et/ou une hiérarchie de produits. Le moteur prévoit en effet les nouveaux produits en détectant automatiquement les produits “plus anciens”, qui peuvent être considérés comme comparables aux nouveaux. Cependant, comme aucune demande n’a encore été observée pour les nouveaux articles, les prévisions reposent entièrement sur les attributs qui leur sont associés.

Utilisez-vous des données externes pour affiner les prévisions ?

Nous pouvons utiliser des données de tarification concurrentielle obtenues généralement auprès de sociétés spécialisées dans le web scraping, par exemple. Les données de trafic web peuvent également être utilisées, et éventuellement acquises, pour enrichir les données historiques afin d’améliorer encore la précision statistique. En pratique, le plus gros obstacle à l’utilisation de sources de données externes n’est pas le moteur de prévision Lokad - qui est assez performant - mais la mise en place et le maintien d’un pipeline de données de haute qualité attaché à ces sources de données externes.