Pronóstico a través de Deep Learning (2018)
De pronósticos probabilísticos a deep learning

En parte por casualidad, resulta que el deep learning tiende a estar fuertemente orientado hacia los pronósticos probabilísticos por diseño. Sin embargo, la motivación para esta perspectiva estaba totalmente desvinculada de las preocupaciones de la cadena de suministro. Los algoritmos de deep learning favorecen la optimización basada en una perspectiva probabilística / bayesiana con métricas como la entropía cruzada porque estas métricas proporcionan valores de gradiente enormes que son especialmente adecuados para el descenso de gradiente estocástico, el algoritmo “único” que hace posible el deep learning.
¡En el caso específico de las cadenas de suministro, resulta que los fundamentos del deep learning están totalmente alineados con los requisitos comerciales reales!
Más allá del bombo de la inteligencia artificial
La inteligencia artificial, impulsada por el deep learning en la práctica, ha sido la palabra de moda del año 2017. Las afirmaciones son audaces, cautivadoras y, bueno, difusas. Desde el punto de vista de Lokad, observamos que la mayoría de estas tecnologías de inteligencia artificial empresarial no están cumpliendo con sus expectativas. Muy pocas empresas pueden asegurar más de medio billón de dólares en financiamiento, como Instacart, para reunir un equipo de deep learning de clase mundial con el fin de abordar con éxito un desafío de cadena de suministro.
Con este lanzamiento, Lokad está poniendo la tecnología de pronóstico de calidad AI al alcance de cualquier empresa razonablemente “digitalizada”. Obviamente, todo el proceso sigue siendo impulsado por datos históricos de la cadena de suministro, por lo que los datos deben ser accesibles para Lokad, pero nuestra tecnología no requiere experiencia en deep learning. A diferencia de prácticamente todas las tecnologías de inteligencia artificial “empresariales”, Lokad no se basa en la ingeniería manual de características. En lo que respecta a nuestros clientes, la actualización desde nuestros pronósticos probabilísticos anteriores al deep learning será perfecta. Lokad es la primera empresa de software en proporcionar una tecnología de pronóstico AI lista para usar, accesible tanto para pequeños ecommerce de una sola persona como para las redes de cadena de suministro más grandes que pueden incluir miles de ubicaciones y un millón de referencias de productos.
La era de la computación con GPU

(*) Para conjuntos de datos ultra pequeños, nuestro motor de pronóstico de quinta generación es en realidad más lento y tarda unos minutos más, lo cual es en gran medida inconsecuente en la práctica.
Lanzamientos de productos y promociones
Nuestro motor de pronóstico de quinta generación está aportando mejoras sustanciales a situaciones de pronóstico difíciles, especialmente en lanzamientos de productos y promociones. Desde nuestro punto de vista, los lanzamientos de productos, aunque muy difíciles, siguen siendo un poco más fáciles que los pronósticos de promociones. La diferencia en la dificultad está impulsada por la calidad de los datos históricos, que es invariablemente menor para las promociones en comparación con los lanzamientos de productos. Los datos de promoción mejoran con el tiempo una vez que se implementan los procesos adecuados de garantía de calidad.
En particular, vemos el deep learning como una gran oportunidad para las marcas de moda que luchan con los lanzamientos de productos que dominan sus ventas: lanzar un nuevo producto no es la excepción, es la regla. Luego, a medida que las variantes de color y tamaño inflan enormemente el número de SKU, la situación se vuelve aún más compleja.
Nuestras preguntas frecuentes sobre pronósticos
¿Qué modelos de pronóstico están utilizando?
Nuestro motor de pronóstico profundo utiliza un solo modelo construido a partir de principios de deep learning. A diferencia de los modelos estadísticos clásicos, es un modelo que cuenta con decenas de millones de parámetros entrenables, lo que equivale a aproximadamente 1000 veces más parámetros que nuestro modelo de aprendizaje automático no profundo más complejo anterior. El deep learning supera drásticamente a los enfoques de aprendizaje automático más antiguos (bosques aleatorios, árboles potenciados por gradiente). Sin embargo, vale la pena señalar que estos enfoques de aprendizaje automático más antiguos ya superaban a todos los clásicos de series temporales (Box-Jenkins, ARIMA, Holt-Winters, suavización exponencial, etc.).
¿Aprenden de sus errores de pronóstico?
Sí. El proceso de entrenamiento estadístico, que en última instancia genera el modelo de deep learning, aprovecha todos los datos históricos disponibles para Lokad. Los datos históricos se aprovechan a través de un proceso conocido como backtesting. Por lo tanto, cuantos más datos históricos estén disponibles para el modelo, más oportunidades tendrá el modelo de aprender de sus propios errores.
¿Su motor de pronóstico maneja estacionalidad, tendencias, días de la semana?
Sí, el motor de pronóstico maneja todas las ciclicidades comunes, e incluso las cuasi-ciclicidades, cuya importancia a menudo se subestima. En cuanto al código, el modelo de deep learning utiliza intensivamente un enfoque de series temporales múltiples para aprovechar las ciclicidades observadas en otros productos, con el fin de mejorar la precisión del pronóstico de cualquier producto dado. Naturalmente, dos productos pueden compartir la misma estacionalidad, pero no el mismo patrón de días de la semana. El modelo es capaz de capturar este patrón. Además, una de las principales ventajas del deep learning es la capacidad de capturar adecuadamente la variabilidad de la estacionalidad en sí misma. De hecho, una temporada puede comenzar antes o después dependiendo de variables externas, como el clima, y esas variaciones se detectan y se reflejan en nuestros pronósticos.
¿Qué datos necesitan?
Al igual que con nuestra generación anterior de tecnología de pronóstico, para prever la demanda, el motor de pronóstico necesita que se le proporcione, al menos, la demanda histórica diaria, y proporcionar un historial de pedidos desagregado es aún mejor. En cuanto a la longitud del historial, cuanto más largo sea, mejor. Si bien no se puede detectar estacionalidad con menos de 2 años de historial, consideramos que 3 años de historial son buenos, y 5 años excelentes. Para prever los tiempos de entrega, el motor generalmente requiere que las órdenes de compra contengan tanto las fechas de pedido como las fechas de entrega. Especificar los atributos de su producto o SKU también ayuda a refinar considerablemente los pronósticos. Además, proporcionar sus niveles de stock también es muy útil para nosotros, para realizar un primer análisis de stock significativo.
¿Pueden pronosticar mi hoja de Excel?
Como regla general, si todos sus datos caben en una hoja de Excel, entonces generalmente no podemos hacer mucho por usted, y siendo honestos, nadie tampoco puede. Es probable que los datos de la hoja de cálculo estén agregados por semana o por mes, y la mayor parte de la información histórica se pierda a través de dicha agregación. Además, en este caso, su hoja de cálculo tampoco contendrá mucha información sobre las categorías y jerarquías que se aplican a sus productos. Nuestro motor de pronóstico aprovecha todos los datos que tiene, y hacer una prueba en una muestra pequeña no dará resultados satisfactorios.
¿Qué pasa con los faltantes de stock y las promociones?
Tanto los faltantes de stock como las promociones representan sesgos en las ventas históricas. Dado que el objetivo es pronosticar la demanda, y no las ventas, este sesgo debe tenerse en cuenta. Una forma frecuente, pero incorrecta, de lidiar con estos eventos consiste en reescribir la historia, para llenar los vacíos y truncar los picos. Sin embargo, no nos gusta este enfoque, porque consiste en alimentar pronósticos al motor de pronóstico, lo que puede resultar en importantes problemas de sobreajuste. En cambio, nuestro motor admite nativamente “flags” que indican dónde la demanda ha sido censurada o inflada.
¿Pueden pronosticar nuevos productos?
Sí, podemos. Sin embargo, para pronosticar nuevos productos, el motor requiere las fechas de lanzamiento de los otros productos “más antiguos”, así como su demanda histórica en el momento del lanzamiento. Además, se recomienda especificar algunas de las categorías de productos y/o una jerarquía de productos. El motor efectivamente pronostica nuevos productos detectando automáticamente los productos “más antiguos”, que pueden considerarse comparables a los nuevos. Sin embargo, como aún no se ha observado demanda para los nuevos artículos, los pronósticos dependen completamente de los atributos asociados con ellos.
¿Utilizan datos externos para refinar los pronósticos?
Podemos utilizar datos de precios competitivos obtenidos típicamente a través de empresas de terceros especializadas en web scraping, por ejemplo. También se pueden utilizar datos de tráfico web, y posiblemente adquiridos, para enriquecer los datos históricos y aumentar aún más la precisión estadística. En la práctica, el mayor cuello de botella en el uso de fuentes de datos externas no es el motor de pronóstico de Lokad, que es bastante capaz, sino configurar y mantener una tubería de datos de alta calidad conectada a esas fuentes de datos externas.