Pronósticos Clásicos de Series Temporales (2008)
Aspectos fundamentales
¿Qué modelos de pronóstico están utilizando?
Abordar esta pregunta es complicado por dos razones: primero, nuestra tecnología de pronóstico es un activo de propiedad intelectual (PI) central que no estamos dispuestos a divulgar en detalle; segundo, nuestra tecnología es compleja y viene con muchos modelos. Dicho esto, Lokad está aprovechando una teoría bien conocida llamada la teoría del aprendizaje estadístico. Esta teoría abarca la mayoría de los métodos de pronóstico modernos como la Regresión de Vectores de Soporte, Redes Bayesianas, métodos de mezcla o de impulso y metaheurísticas que incluyen redes neuronales o algoritmos genéticos… Entonces, tampoco descartamos los clásicos: autorregresión lineal, promedio móvil, suavizado exponencial (doble, triple), Box-Jenkins, Holt-Winters, ARMA, ARIMA. Sin embargo, esos clásicos suelen ser muy débiles cuando se trata de aprovechar las correlaciones entre series temporales.
¿Qué tan precisos son sus pronósticos?
La precisión del pronóstico depende en gran medida del conjunto de datos específico que se esté considerando. Hemos encontrado situaciones donde un error del 0.5% se consideraba pobre (como los pronósticos de consumo de electricidad a nivel nacional por hora con 24 horas de anticipación) y otras situaciones donde un error del 80% se consideraba excelente (como una operación promocional única realizada durante el lanzamiento de un producto). La precisión depende en gran medida del horizonte - cuanto más lejos estén los pronósticos, menos precisos serán -, pero también depende en gran medida del nivel de agregación - cuanto más agregados estén los pronósticos, más precisos serán.
Competiciones de pronóstico, ¿tienen alguna validación académica de su tecnología?
Hay muchas competiciones de minería de datos que tienen lugar cada año. En Lokad, generalmente estamos atentos a esos eventos y rutinariamente comparamos nuestra tecnología de pronóstico con los conjuntos de datos de esas competiciones cuando los datos son relevantes para Lokad (solo procesamos series temporales, no imágenes o perfiles de clientes, por ejemplo). Aunque, hasta la fecha, aún no hemos observado ninguna competición pública de minería de datos que consideremos representativa de los desafíos a los que nos enfrentamos a diario. En primer lugar, los conjuntos de datos académicos tienden a ser pequeños - menos de unos cientos de series temporales - con series temporales largas - cientos de puntos de datos por serie temporal. Esto es casi lo contrario de lo que observamos típicamente en el comercio minorista: miles, si no millones, de series temporales, pero series muy cortas porque los productos tienen una vida corta. Dicho esto, Lokad suele desempeñarse bien en esas competiciones, y muy bien si se tiene en cuenta que, con Lokad, los resultados se obtienen de inmediato, no se requiere experiencia para producir los resultados.
¿Evalúan la precisión de sus pronósticos?
Sí, lo hacemos. Las mediciones precisas cuantitativas de la precisión del pronóstico logradas con nuestra tecnología de pronóstico representan aproximadamente la mitad de nuestra tecnología principal. Sin entrar demasiado en los detalles, diremos que es un gran desafío, no solo producir modelos que realmente se ajusten a sus datos, sino que también resulten realmente buenos en los datos que aún no tiene, es decir, datos futuros. Vea también Sobreajuste: cuando la medida de precisión falla. La tarea diaria típica del equipo de I+D de Lokad consiste en ejecutar una y otra vez nuestro motor de pronóstico sobre los conjuntos de datos de los clientes, medir los errores de pronóstico e intentar reducirlos. Luego, un aspecto notable de nuestra tecnología es que no solo obtiene pronósticos, sino que también, para cada valor pronosticado, obtiene la precisión esperada de este valor, expresada como un error MAPE. Por lo tanto, no tiene que esperar para descubrir finalmente que un pronóstico era poco confiable, Lokad le brinda la información por adelantado para que ajuste su estrategia en consecuencia.
¿Cuántos datos históricos necesita?
No hay un requisito mínimo para la cantidad de datos históricos. Dicho esto, Lokad ofrece una tecnología estadística, por lo tanto, cuantos más datos históricos, más precisos serán los pronósticos. En la práctica, se consideran buenos 2 años de datos históricos, y 3 años o más se consideran excelentes. Si tiene menos de 1 año de datos históricos, entonces Lokad no podrá refinar los pronósticos a través de la estacionalidad, que es un patrón importante para muchas empresas. Además, para aprovechar la estacionalidad, Lokad no necesita más de 1 año en cada serie temporal (es decir, ventas de productos), solo necesitamos tener un par de series temporales con más de 1 año de historia para establecer los perfiles de estacionalidad que existen en su negocio. Para startups y empresas emergentes, Lokad se puede utilizar desde el principio. De hecho, entregamos no solo pronósticos, sino también la precisión esperada del pronóstico. Por lo tanto, los primeros pronósticos suelen tener niveles de error muy altos y mejoran gradualmente con el tiempo. Lokad le ofrece una forma de cuantificar la incertidumbre también.
Patrones generales
Tendencias macro (por ejemplo, crisis financiera), ¿cómo se manejan?
Creemos que hay dos malentendidos típicos sobre las tendencias macro. En primer lugar, las tendencias macro solo se pueden aprovechar para refinar los pronósticos de demanda si esas tendencias macro mismas pueden predecirse con precisión. Si los bancos hubieran podido prever la crisis financiera, no habría habido una crisis en primer lugar. Predecir las tendencias macro suele ser mucho más difícil que predecir la demanda de su producto promedio, por lo que a menudo es una opción bastante intratable. En segundo lugar, una recesión del -3% / año se considera una gran tendencia macro, pero en la práctica significa un impacto del -0.06% a nivel semanal. En comparación, observamos rutinariamente variaciones en las ventas de productos del 20% de una semana a otra. Lokad es más adecuado para pronósticos a corto plazo, y mirando unas semanas hacia adelante, las tendencias macro suelen ser típicamente opacadas por factores microeconómicos como promociones, canibalización, campañas publicitarias, … En conclusión, Lokad suele ignorar la mayoría de las tendencias macro, pero en nuestra experiencia, es la única opción razonable para el 99% de las situaciones.
Estacionalidad, tendencia, ¿cómo se manejan?
Detectamos automáticamente patrones basados en el calendario. No es necesario decirle a Lokad que un producto es estacional, la estacionalidad es un patrón frecuente abordado nativamente por nuestra tecnología de pronóstico. De hecho, la estacionalidad es mucho más compleja de lo que la mayoría de la gente espera. A nuestro parecer, no hay una estacionalidad sino muchos patrones cíclicos que interactúan de múltiples maneras. Están la estacionalidad anual, el efecto del día de la semana, el efecto del día de pago a nivel mensual, la estacionalidad cuasi-anual como el día de la madre celebrado el segundo domingo de mayo en los EE. UU., … Además, al considerar los pronósticos de ventas a nivel del Punto de Venta, los patrones cíclicos de los productos se combinan con los patrones cíclicos del propio Punto de Venta. De hecho, cada Punto de Venta tiene un entorno más o menos único que genera sus propios patrones de demanda. Por lo tanto, la estacionalidad no se trata solo de proporcionar una bandera de SÍ/NO, es un conjunto bastante complejo de patrones interdependientes. La buena noticia es que Lokad maneja esta complejidad por ti.
¿Pascua, Ramadán, Día de la Madre y otros eventos cuasi-estacionales?
Algunos patrones del calendario son, en la jerga de Lokad, cuasi-estacionales: los patrones se repiten de un año a otro, pero no son estrictamente anuales en el sentido del calendario gregoriano (también conocido como el calendario occidental o cristiano). Pascua, Ramadán, Año Nuevo Chino, Día de la Madre son tantos ejemplos de patrones cuasi-estacionales. Lokad detecta automáticamente patrones cuasi-estacionales, por lo que no es necesario dedicar ningún esfuerzo específico para manejar esos patrones. Luego, de manera muy similar a la estacionalidad clásica, Lokad se basa principalmente en el análisis de múltiples series temporales para detectar series temporales que tienen patrones cuasi-estacionales similares para refinar el análisis de patrones.
Ciclos de vida de productos y lanzamientos de productos, ¿cómo se manejan?
La mayoría de los bienes de consumo pasan por un ciclo de vida. Los productos se lanzan, crecen, se marchitan y finalmente se eliminan del mercado. Lokad puede pronosticar las ventas en el lanzamiento, considerando que se proporciona la fecha de lanzamiento. Obviamente, cuando un producto está a punto de ser lanzado, no hay datos de ventas disponibles para este mismo producto para respaldar el pronóstico. Sin embargo, a diferencia de los kits de herramientas de pronóstico clásicos, Lokad no se trata solo de pronósticos clásicos de series temporales. En particular, los productos pueden describirse a través de etiquetas. Una etiqueta puede representar casi cualquier propiedad del producto: categoría, subcategoría, familia, marca, color, tamaño, … Para pronosticar las ventas de un producto que se está lanzando, Lokad analiza lanzamientos históricos de productos similares, y las similitudes se evalúan en función de las etiquetas proporcionadas para cada producto. Aplicamos el mismo principio para otros patrones de ciclo de vida.
Productos intermitentes / de bajo volumen, ¿cómo se manejan?
Si tienes un producto que se vende una vez al año, bueno, hay poco que se pueda hacer en cuanto a pronósticos estadísticos se refiere. En la práctica, es más una elección de marketing tener 1 unidad en stock o cero. Sin embargo, entre este caso extremo de movimiento lento y tus productos más vendidos, hay toda una zona gris de productos que se venden con poca frecuencia pero lo suficientemente frecuente como para requerir optimización de inventario. La mayoría de los kits de herramientas de pronóstico clásicos se comportan mal frente a las ventas intermitentes. En Lokad, hemos dedicado muchos esfuerzos a este patrón de demanda porque muchas empresas, como el comercio electrónico, dependen en gran medida de la larga cola para alcanzar la rentabilidad. Sin embargo, los productos de movimiento lento, a menos que se gestionen cuidadosamente, pueden generar incluso más inventario que los productos más vendidos. Para lidiar con los productos de movimiento lento, sugerimos optar por pronósticos probabilísticos.
Clima, ¿cómo se maneja?
En ciertos negocios, como las tiendas de comestibles, el clima es un factor de demanda muy importante. Hasta el momento, Lokad no está aprovechando los pronósticos del clima como entrada en nuestra tecnología de pronóstico. Aunque este elemento forma parte de nuestra hoja de ruta a medio plazo. Nuestro objetivo no es solo admitir entradas de clima, sino también automatizar en gran medida el proceso, de modo que básicamente requeriría un esfuerzo cercano a cero por parte de nuestros clientes para beneficiarse de la precisión adicional.
Artefactos de demanda
Ventas perdidas causadas por faltantes de stock, ¿cómo se manejan?
Las ventas no equivalen a la demanda. Un faltante de stock es un artefacto que distorsiona las ventas lejos de la demanda original. De hecho, un faltante de stock hace que las ventas disminuyan mientras que la demanda permanece constante. A diferencia de los kits de herramientas de pronóstico clásicos, con Lokad, no es necesario alterar o ajustar tus datos históricos en un intento de expresar las ventas que habrían ocurrido si no se hubieran producido faltantes de stock. En su lugar, los eventos se pueden utilizar para indicar cuándo se produjeron los faltantes de stock. La información sobre faltantes de stock se utiliza para estimar de manera más precisa todos los patrones que habrían sido afectados (estacionalidad, tendencia, …) de lo contrario. Si los faltantes de stock no se marcan como tales con eventos, Lokad filtra esos patrones como ruido. Llevar un registro de los faltantes de stock es algo bueno tener, pero no es un requisito para comenzar con Lokad.
Ventas excepcionales, ¿cómo se manejan?
Dependiendo de tu industria, tu negocio podría enfrentar ventas excepcionales. Dado que esas ventas son, bueno, excepcionales en tamaño, también suelen ser bastante fáciles de detectar con un enfoque puramente estadístico. Por lo tanto, sugerimos no ajustar tus datos históricos para limpiar esas ventas excepcionales. En primer lugar, probablemente sea una pérdida de tiempo, en segundo lugar, las ventas excepcionales en sí mismas pueden contener información valiosa que ayuda a pronosticar la demanda. Entonces, Lokad no puede pronosticar ventas excepcionales futuras individuales, que pueden depender del resultado de una negociación, por ejemplo. Si hay ventas excepcionales conocidas por delante, sugerimos anular manualmente los pronósticos de Lokad con la información adicional.
Agregación, ¿de arriba hacia abajo o de abajo hacia arriba?
Algunas empresas pronostican la demanda a nivel de grupos o familias y luego dividen esos pronósticos para llegar a productos individuales. Este es un método de pronóstico de arriba hacia abajo del producto. La misma idea se puede aplicar para pronosticar la frecuencia: algunas empresas pronostican primero a nivel semanal y luego aplican coeficientes por día de la semana. En este caso, este es un método de pronóstico de arriba hacia abajo de la frecuencia. A la inversa, los pronósticos semanales se pueden producir sumando los pronósticos diarios. En Lokad, sugerimos ajustar tus pronósticos para que se ajusten lo más posible a tus necesidades operativas: si la cadena de suministro necesita pronósticos semanales para cada producto, entonces solicita pronósticos semanales para cada producto a Lokad. Solicitar pronósticos diarios y luego sumar esos pronósticos no mejorará tu precisión. Siguiendo la misma idea, permitir que Lokad pronostique las ventas a nivel de grupo de productos y luego dividir manualmente los pronósticos para cada SKU es una mala idea, porque es probable que se introduzca un error significativo en el pronóstico a través de la división en sí misma. Internamente, Lokad se basa en muchos algoritmos de agregación/desagregación, y típicamente nos gusta aprovechar los datos más detallados disponibles. Por ejemplo, utilizamos datos de ventas diarias para entregar pronósticos mensuales. De hecho, un mes puede venir con 4 o 5 fines de semana que impactan significativamente a la mayoría de los negocios minoristas. Como de costumbre, no tienes que preocuparte por el nivel de agregación, Lokad maneja tus requisitos.