De la prévision probabiliste au deep learning
Par hasard, il se trouve que le deep learning est particulièrement adapté aux prévisions probabilistes par conception. La motivation de cette perspective était cependant totalement indépendante des préoccupations de la chaîne d’approvisionnement. Les algorithmes de deep learning favorisent l’optimisation basée sur une perspective probabiliste / bayésienne avec des métriques telles que l’entropie croisée, car ces métriques fournissent des valeurs de gradient énormes qui conviennent particulièrement à la descente de gradient stochastique, l’algorithme “un” qui rend le deep learning possible.
Dans le cas spécifique des chaînes d’approvisionnement, il se trouve que les fondements du deep learning sont parfaitement alignés sur les exigences commerciales réelles !
Au-delà du battage médiatique de l’intelligence artificielle
L’intelligence artificielle - alimentée par le deep learning en pratique - a été le mot à la mode de l’année 2017. Les revendications sont audacieuses, enthousiasmantes et, eh bien, floues. Du point de vue de Lokad, nous constatons que la majorité de ces technologies d’IA d’entreprise ne sont pas à la hauteur de leurs attentes. Très peu d’entreprises peuvent obtenir plus d’un demi-milliard de dollars de financement, comme Instacart, pour constituer une équipe de deep learning de classe mondiale afin de relever avec succès un défi de chaîne d’approvisionnement.
Avec cette version, Lokad rend la technologie de prévision de qualité IA accessible à toute entreprise raisonnablement “digitalisée”. Évidemment, tout cela est toujours alimenté par des données historiques de la chaîne d’approvisionnement, donc les données doivent être accessibles à Lokad, mais notre technologie ne nécessite aucune expertise en deep learning. Contrairement à pratiquement toutes les technologies d’IA “d’entreprise”, Lokad ne repose pas sur l’ingénierie manuelle des caractéristiques. En ce qui concerne nos clients, la transition de nos prévisions probabilistes précédentes au deep learning se fera en toute transparence. Lokad est la première entreprise de logiciels à fournir une technologie de prévision de qualité IA clé en main, accessible aussi bien aux petites entreprises de commerce électronique qu’aux plus grands réseaux de chaîne d’approvisionnement pouvant inclure des milliers de sites et un million de références de produits.
L’ère du calcul GPU
(*) Pour les ensembles de données ultra-petits, notre moteur de prévision de 5e génération est en réalité plus lent et prend quelques minutes de plus - ce qui est largement insignifiant en pratique.
Lancement de produits et promotions
Notre moteur de prévision de 5e génération apporte des améliorations substantielles aux situations de prévision difficiles, notamment les lancements de produits et les promotions. De notre point de vue, les lancements de produits, bien que très difficiles, restent un peu plus faciles que les prévisions de promotions. La différence de difficulté est due à la qualité des données historiques, qui est invariablement inférieure pour les promotions par rapport aux lancements de produits. Les données de promotion s’améliorent avec le temps une fois que les processus appropriés d’assurance qualité sont en place.
En particulier, nous considérons le deep learning comme une opportunité massive pour les marques de mode qui ont du mal avec les lancements de produits qui dominent leurs ventes : le lancement d’un nouveau produit n’est pas l’exception, c’est la règle. Ensuite, à mesure que les variantes de couleur et de taille gonflent considérablement le nombre de références de produits, la situation devient encore plus complexe.
Notre FAQ sur les prévisions
Quels modèles de prévision utilisez-vous ?
Notre moteur de prévision avancé utilise un modèle unique basé sur les principes du deep learning. Contrairement aux modèles statistiques classiques, il s’agit d’un modèle qui comporte des dizaines de millions de paramètres entraînables, soit environ 1000 fois plus de paramètres que notre modèle d’apprentissage automatique non deep learning le plus complexe précédent. Le deep learning surpasse largement les anciennes approches d’apprentissage automatique (forêts aléatoires, arbres boostés par gradient). Cependant, il convient de noter que ces anciennes approches d’apprentissage automatique surpassaient déjà tous les classiques des séries temporelles (Box-Jenkins, ARIMA, Holt-Winters, lissage exponentiel, etc).
Apprenez-vous de vos erreurs de prévision ?
Oui. Le processus de formation statistique - qui génère finalement le modèle de deep learning - exploite toutes les données historiques disponibles chez Lokad. Les données historiques sont exploitées grâce à un processus appelé backtesting. Ainsi, plus il y a de données historiques disponibles pour le modèle, plus le modèle a d’opportunités pour apprendre de ses propres erreurs.
Votre moteur de prévision gère-t-il la saisonnalité, les tendances, les jours de la semaine ?
Oui, le moteur de prévision gère toutes les cyclicités courantes, et même les quasi-cyclicités, dont l’importance est souvent sous-estimée. En ce qui concerne le code, le modèle de deep learning utilise intensivement une approche de séries temporelles multiples pour exploiter les cyclicités observées dans d’autres produits, afin d’améliorer la précision des prévisions pour un produit donné. Naturellement, deux produits peuvent partager la même saisonnalité, mais pas le même modèle de jours de la semaine. Le modèle est capable de capturer ce modèle. De plus, l’un des principaux avantages du deep learning est la capacité à capturer correctement la variabilité de la saisonnalité elle-même. En effet, une saison peut commencer plus tôt ou plus tard en fonction de variables externes, telles que la météo, et ces variations sont détectées et reflétées dans nos prévisions.
Quelles données avez-vous besoin ?
Comme c’était le cas avec notre génération précédente de technologie de prévision, pour prévoir la demande, le moteur de prévision doit être fourni - au moins - avec les données historiques de la demande quotidienne, et fournir un historique des commandes désagrégé est encore mieux. En ce qui concerne la longueur de l’historique - plus il est long, mieux c’est. Bien qu’aucune saisonnalité ne puisse être détectée avec moins de 2 ans d’historique, nous considérons que 3 ans d’historique sont bons et 5 ans excellents. Pour prévoir les délais de livraison, le moteur nécessite généralement que les bons de commande contiennent à la fois les dates de commande et les dates de livraison. Spécifier les attributs de votre produit ou SKU contribue également à affiner considérablement les prévisions. De plus, fournir vos niveaux de stock nous est également très utile pour vous fournir une première analyse de stock significative.
Pouvez-vous prévoir mon fichier Excel ?
En règle générale, si toutes vos données rentrent dans une seule feuille Excel, alors nous ne pouvons généralement pas faire grand-chose pour vous, et pour être honnête, personne ne le peut non plus. Les données de feuille de calcul sont susceptibles d’être agrégées par semaine ou par mois, et la plupart des informations historiques sont perdues par le biais de cette agrégation. De plus, dans ce cas, votre feuille de calcul ne contiendra pas non plus beaucoup d’informations sur les catégories et les hiérarchies qui s’appliquent à vos produits. Notre moteur de prévision exploite toutes les données dont vous disposez, et effectuer un test sur un petit échantillon ne donnera pas de résultats satisfaisants.
Qu’en est-il des ruptures de stock et des promotions ?
Les ruptures de stock et les promotions représentent un biais dans les ventes historiques. Étant donné que l’objectif est de prévoir la demande, et non les ventes, ce biais doit être pris en compte. Une façon fréquente - mais incorrecte - de traiter ces événements consiste à réécrire l’historique, pour combler les lacunes et tronquer les pics. Cependant, nous n’aimons pas cette approche, car elle consiste à fournir des prévisions au moteur de prévision, ce qui peut entraîner des problèmes de surajustement majeurs. Au lieu de cela, notre moteur prend en charge nativement des “drapeaux” qui indiquent où la demande a été censurée ou gonflée.
Prévoyez-vous les nouveaux produits ?
Oui, nous le faisons. Cependant, pour prévoir les nouveaux produits, le moteur nécessite les dates de lancement des autres produits “plus anciens”, ainsi que leur demande historique au moment du lancement. Il est également conseillé de spécifier certaines de vos catégories de produits et/ou une hiérarchie de produits. Le moteur prévoit en effet les nouveaux produits en détectant automatiquement les produits “plus anciens”, qui peuvent être considérés comme comparables aux nouveaux. Cependant, comme aucune demande n’a encore été observée pour les nouveaux articles, les prévisions reposent entièrement sur les attributs qui leur sont associés.
Utilisez-vous des données externes pour affiner les prévisions ?
Nous pouvons utiliser des données de tarification concurrentielle obtenues généralement auprès de sociétés spécialisées dans le web scraping, par exemple. Les données de trafic web peuvent également être utilisées, et éventuellement acquises, pour enrichir les données historiques afin d’améliorer encore la précision statistique. En pratique, le plus gros obstacle à l’utilisation de sources de données externes n’est pas le moteur de prévision Lokad - qui est assez performant - mais la mise en place et le maintien d’un pipeline de données de haute qualité attaché à ces sources de données externes.