Klassische Zeitreihenprognosen (2008)
Grundlagen
Welche Prognosemodelle verwenden Sie?
Die Beantwortung dieser Frage ist aus zwei Gründen schwierig: Erstens ist unsere Prognosetechnologie ein wesentliches geistiges Eigentum (IP), das wir nicht im Detail offenlegen möchten, und zweitens ist unsere Technologie komplex und umfasst viele Modelle. Lokad nutzt jedoch eine bekannte Theorie namens statistische Lerntheorie. Diese Theorie umfasst die meisten modernen Prognosemethoden wie Support Vector Regression, Bayesian Networks, Misch- oder Boosting-Methoden und Metaheuristiken, einschließlich neuronaler Netze oder genetischer Algorithmen… Wir vernachlässigen jedoch auch nicht die guten alten Klassiker: lineare Autoregression, gleitender Durchschnitt, (doppelte, dreifache) exponentielle Glättung, Box-Jenkins, Holt-Winters, ARMA, ARIMA. Diese Klassiker sind jedoch in der Regel sehr schwach, wenn es darum geht, Korrelationen zwischen Zeitreihen zu nutzen.
Wie genau sind Ihre Prognosen?
Die Prognosegenauigkeit hängt stark von dem spezifischen betrachteten Datensatz ab. Wir haben Situationen erlebt, in denen ein Fehler von 0,5% als schlecht angesehen wurde (zum Beispiel stündliche Prognosen des landesweiten Stromverbrauchs 24 Stunden im Voraus) und andere Situationen, in denen ein Fehler von 80% als ausgezeichnet angesehen wurde (zum Beispiel eine einmalige Werbeaktion während eines Produktstarts). Die Genauigkeit hängt stark vom Horizont ab - je weiter die Prognosen in die Zukunft reichen, desto ungenauer sind sie -, aber die Genauigkeit hängt auch stark vom Aggregationsniveau ab - je stärker die Prognosen aggregiert sind, desto genauer sind sie.
Prognosewettbewerbe, haben Sie eine akademische Validierung Ihrer Technologie?
Jedes Jahr finden zahlreiche Datamining-Wettbewerbe statt. Bei Lokad behalten wir in der Regel diese Veranstaltungen im Auge und benchmarken routinemäßig unsere Prognosetechnologie anhand dieser Wettbewerbsdatensätze, wenn die Daten für Lokad relevant sind (wir verarbeiten nur Zeitreihen, keine Bilder oder Kundenprofile zum Beispiel). Obwohl wir bisher noch keinen öffentlichen Datamining-Wettbewerb beobachtet haben, von dem wir glauben, dass er die Herausforderungen widerspiegelt, mit denen wir täglich konfrontiert sind. Erstens neigen akademische Datensätze dazu, klein zu sein - weniger als einige hundert Zeitreihen - mit langen Zeitreihen - Hunderte von Datenpunkten pro Zeitreihe. Dies steht im Gegensatz zu dem, was wir typischerweise im Einzelhandel beobachten: Tausende, wenn nicht Millionen von Zeitreihen, aber sehr kurze Serien, weil Produkte nur kurzlebig sind. Trotzdem schneidet Lokad in diesen Wettbewerben in der Regel gut ab, und sehr gut, wenn man bedenkt, dass bei Lokad die Ergebnisse sofort und ohne Fachkenntnisse erzielt werden.
Bewerten Sie die Genauigkeit Ihrer Prognosen?
Ja, das tun wir. Präzise quantitative Messungen der Genauigkeit der Prognosen, die mit unserer Prognosetechnologie erzielt werden, machen etwa die Hälfte unserer Kerntechnologie aus. Ohne zu sehr ins Detail zu gehen, lassen Sie uns sagen, dass es eine große Herausforderung ist, nicht nur Modelle zu erstellen, die tatsächlich zu Ihren Daten passen, sondern auch wirklich gut auf Daten zu sein, die Sie noch nicht haben, d.h. zukünftige Daten. Siehe auch Overfitting: wenn die Genauigkeitsmessung schief geht. Die typische tägliche Aufgabe des Lokad R&D-Teams besteht darin, immer wieder unseren Prognosemotor über Kundendatensätze laufen zu lassen, Prognosefehler zu messen und zu versuchen, sie zu reduzieren. Ein bemerkenswerter Aspekt unserer Technologie ist, dass Sie nicht nur Prognosen erhalten, sondern auch für jeden prognostizierten Wert die erwartete Genauigkeit dieses Werts erhalten, ausgedrückt als MAPE Fehler. Daher müssen Sie nicht darauf warten, dass Sie schließlich feststellen, dass eine Prognose wenig zuverlässig war, Lokad gibt Ihnen die Informationen im Voraus, damit Sie Ihre Strategie entsprechend anpassen können.
Wie viel historische Daten benötigen Sie?
Es gibt keine Mindestanforderung an die Menge historischer Daten. Lokad liefert jedoch eine statistische Technologie, daher gilt: je mehr historische Daten, desto genauer die Prognosen. In der Praxis gelten 2 Jahre historische Daten als gut, und 3 Jahre oder mehr gelten als ausgezeichnet. Wenn Sie weniger als 1 Jahr historische Daten haben, kann Lokad die Prognosen nicht durch Saisonalität verfeinern, was ein wichtiges Muster für viele Unternehmen ist. Um die Saisonalität zu nutzen, benötigt Lokad auch nicht mehr als 1 Jahr für jede einzelne Zeitreihe (d.h. Produktsales), wir müssen nur ein paar Zeitreihen mit mehr als 1 Jahr Geschichte haben, um die saisonalen Profile zu etablieren, die in Ihrem Unternehmen existieren. Für Startups und aufstrebende Unternehmen kann Lokad von Anfang an verwendet werden. Tatsächlich liefern wir nicht nur Prognosen, sondern auch die erwartete Prognosegenauigkeit. Daher weisen die ersten Prognosen in der Regel sehr hohe Fehlerwerte auf und verbessern sich im Laufe der Zeit allmählich. Lokad bietet Ihnen auch eine Möglichkeit, die Unsicherheit zu quantifizieren.
Allgemeine Muster
Makrotrends (z.B. Finanzkrise), wie werden sie behandelt?
Wir glauben, dass es zwei typische Missverständnisse über Makrotrends gibt. Erstens können Makrotrends nur genutzt werden, um die Nachfrageprognosen zu verfeinern, wenn diese Makrotrends selbst genau prognostiziert werden können. Wenn Banken die Finanzkrise hätten vorhersagen können, hätte es die Krise erst gar nicht gegeben. Die Prognose von Makrotrends ist typischerweise viel schwieriger als die Prognose der Nachfrage nach Ihrem durchschnittlichen Produkt, daher ist es häufig eine eher unlösbare Option. Zweitens wird eine Rezession von -3% / Jahr als großer Makrotrend betrachtet, aber in der Praxis bedeutet dies eine Auswirkung von -0,06% auf wöchentlicher Ebene. Im Vergleich dazu beobachten wir regelmäßig Produktsales, die von einer Woche zur nächsten um 20% variieren. Lokad ist am besten für kurzfristige Prognosen geeignet, und wenn man ein paar Wochen vorausschaut, werden Makrotrends typischerweise von mikroökonomischen Faktoren wie Promotionen, Kannibalisierung, Werbekampagnen usw. überlagert. Zusammenfassend lässt Lokad in der Regel die meisten Makrotrends außer Acht, aber unserer Erfahrung nach ist dies die einzige vernünftige Option für 99% der Situationen.
Saisonalität, Trend, wie werden sie behandelt?
Wir erkennen automatisch kalenderbasierte Muster. Sie müssen Lokad nicht mitteilen, dass ein Produkt saisonal ist, Saisonalität ist ein häufiges Muster, das von unserer Prognosetechnologie nativ behandelt wird. Tatsächlich ist Saisonalität viel komplexer als die meisten Menschen erwarten. Aus unserer Sicht gibt es nicht nur eine Saisonalität, sondern viele zyklische Muster, die auf vielfältige Weise interagieren. Es gibt die jährliche Saisonalität, den Wochentagseffekt, den Gehaltseingangseffekt auf monatlicher Ebene, die quasi-jährliche Saisonalität wie Muttertag, der am 2. Sonntag im Mai in den USA gefeiert wird, … Darüber hinaus, wenn man Verkaufsprognosen auf der Point of Sale-Ebene betrachtet, dann werden zyklische Muster der Produkte mit zyklischen Mustern des Point of Sale selbst kombiniert. Tatsächlich hat jeder Point of Sale eine mehr oder weniger einzigartige Umgebung, die ihre eigenen Nachfragemuster generiert. Daher geht es bei der Saisonalität nicht nur darum, eine YES/NO-Flagge anzugeben, sondern um eine recht komplexe Reihe von voneinander abhängigen Mustern. Die gute Nachricht ist, dass Lokad diese Komplexität für Sie verwaltet.
Ostern, Ramadan, Muttertag und andere quasi-saisonale Ereignisse?
Einige Kalendermuster sind in Lokads Jargon quasi-saisonal: Muster wiederholen sich von einem Jahr zum nächsten, sind aber nicht streng jährlich im Sinne des Gregorianischen Kalenders (auch bekannt als westlicher oder christlicher Kalender). Ostern, Ramadan, chinesisches Neujahr, Muttertag sind Beispiele für quasi-saisonale Muster. Lokad erkennt quasi-saisonale Muster automatisch, sodass Sie keine spezifischen Anstrengungen unternehmen müssen, um diese Muster zu behandeln. Dann, ähnlich wie bei der klassischen Saisonalität, verlässt sich Lokad hauptsächlich auf die Analyse mehrerer Zeitreihen, um Zeitreihen zu erkennen, die ähnliche quasi-saisonale Muster aufweisen, um die Musteranalyse zu verfeinern.
Produktlebenszyklen und Produktstarts, wie werden sie behandelt?
Die meisten Konsumgüter durchlaufen einen Lebenszyklus. Produkte werden eingeführt, wachsen, verkümmern und werden schließlich vom Markt genommen. Lokad kann den Absatz bei der Einführung prognostizieren, vorausgesetzt, das Einführungsdatum ist bekannt. Offensichtlich, wenn ein Produkt kurz vor der Einführung steht, stehen keine Verkaufsdaten für dieses spezielle Produkt zur Verfügung, um die Prognose zu unterstützen. Doch im Gegensatz zu klassischen Prognose-Toolkits geht es bei Lokad nicht nur um klassische Zeitreihenprognosen. Produkte können insbesondere durch Tags beschrieben werden. Ein Tag kann jede Eigenschaft des Produkts darstellen: Kategorie, Unterkategorie, Familie, Marke, Farbe, Größe, … Um den Absatz eines einzuführenden Produkts vorherzusagen, analysiert Lokad historische Einführungen ähnlicher Produkte, und Ähnlichkeiten werden anhand der für jedes Produkt bereitgestellten Tags bewertet. Wir wenden dasselbe Prinzip für andere Lebenszyklusmuster an.
Unterbrochene / geringfügige Produkte, wie werden sie behandelt?
Wenn Sie ein Produkt haben, das einmal im Jahr verkauft wird, gibt es wenig, was in Bezug auf statistische Prognosen getan werden kann. In der Praxis handelt es sich eher um eine Marketingentscheidung, ob 1 Einheit im Geschäft vorhanden ist oder nicht. Zwischen diesem extrem langsamen Fall und Ihren Bestsellern gibt es jedoch einen ganzen Graubereich von Produkten, die selten verkauft werden, aber dennoch häufig genug sind, um eine Bestandsoptimierung zu erfordern. Die meisten klassischen Prognose-Toolkits verhalten sich schlecht gegenüber intermittierenden Verkäufen. Bei Lokad haben wir uns sehr um dieses Nachfragemuster gekümmert, da viele Unternehmen, wie z.B. E-Commerce, stark auf den Long Tail angewiesen sind, um profitabel zu werden. Dennoch können langsame Beweger, wenn sie nicht sorgfältig verwaltet werden, sogar mehr Bestand erzeugen als Bestseller. Um mit langsamen Bewegern umzugehen, empfehlen wir, auf probabilistische Prognosen zu setzen.
Wetter, wie wird es behandelt?
In bestimmten Branchen, wie z.B. Lebensmittelgeschäften, ist das Wetter ein sehr wichtiger Nachfragefaktor. Lokad nutzt derzeit keine Wettervorhersagen als Eingabe in unsere Prognosetechnologie. Dieser Punkt ist jedoch Teil unserer mittelfristigen Roadmap. Unser Ziel ist es nicht nur, Wetterdaten zu unterstützen, sondern den Prozess erheblich zu automatisieren, so dass es im Wesentlichen kaum Aufwand von unseren Kunden erfordert, von der zusätzlichen Genauigkeit zu profitieren.
Nachfrageartefakte
Verlorene Verkäufe aufgrund von Lagerausfällen, wie werden sie behandelt?
Verkäufe entsprechen nicht der Nachfrage. Ein Lagerausfall ist ein Artefakt, das Verkäufe von der ursprünglichen Nachfrage abweichen lässt. Tatsächlich führt ein Lagerausfall dazu, dass die Verkäufe sinken, während die Nachfrage stabil bleibt. Im Gegensatz zu klassischen Prognose-Toolkits müssen Sie mit Lokad Ihre historischen Daten nicht ändern oder anpassen, um Verkäufe auszudrücken, die stattgefunden hätten, wenn keine Lagerausfälle stattgefunden hätten. Stattdessen können Ereignisse verwendet werden, um anzuzeigen, wann Lagerausfälle aufgetreten sind. Informationen zu Lagerausfällen werden verwendet, um alle Muster genauer zu schätzen, die sonst beeinflusst worden wären (Saisonalität, Trend, …). Wenn Lagerausfälle nicht als solche mit Ereignissen gekennzeichnet sind, filtert Lokad diese Muster als Rauschen heraus. Das Verfolgen von Lagerausfällen ist schön zu haben, aber keine Voraussetzung, um mit Lokad zu beginnen.
Außergewöhnliche Verkäufe, wie werden sie behandelt?
Je nach Branche kann Ihr Unternehmen außergewöhnliche Verkäufe verzeichnen. Da diese Verkäufe, nun ja, außergewöhnlich groß sind, sind sie auch in der Regel recht einfach mit einem rein statistischen Ansatz zu erkennen. Daher empfehlen wir, Ihre historischen Daten nicht zu ändern, um diese außergewöhnlichen Verkäufe zu bereinigen. Erstens ist es wahrscheinlich Zeitverschwendung, zweitens können außergewöhnliche Verkäufe selbst wertvolle Informationen enthalten, die bei der Prognose der Nachfrage helfen. Lokad kann keine individuellen zukünftigen außergewöhnlichen Verkäufe prognostizieren - die beispielsweise vom Ergebnis einer Verhandlung abhängen können. Wenn ein bekannter außergewöhnlicher Verkauf bevorsteht, empfehlen wir, die Lokad-Prognosen manuell mit dem zusätzlichen Informationsstück zu überschreiben.
Aggregation, top-down oder bottom-up?
Einige Unternehmen prognostizieren die Nachfrage auf Gruppen- oder Familienebene und teilen dann diese Prognosen auf, um einzelne Produkte zu erreichen. Dies ist eine top-down Prognosemethode für Produkte. Die gleiche Idee kann auf die Prognosefrequenz angewendet werden: Einige Unternehmen prognostizieren zuerst auf wöchentlicher Ebene und wenden dann Tages-der-Woche-Koeffizienten an. In diesem Fall handelt es sich um eine top-down Prognosemethode für die Frequenz. Umgekehrt können wöchentliche Prognosen erstellt werden, indem tägliche Prognosen summiert werden. Bei Lokad empfehlen wir, Ihre Prognosen so anzupassen, dass sie Ihren betrieblichen Anforderungen so genau wie möglich entsprechen: Wenn die Supply Chain wöchentliche Prognosen für jedes Produkt benötigt, fordern Sie wöchentliche Prognosen für jedes Produkt von Lokad an. Das Anfordern täglicher Prognosen und das Summieren dieser Prognosen verbessert nicht Ihre Genauigkeit. Nach dem gleichen Prinzip ist es keine gute Idee, Lokad die Verkaufsprognosen auf Gruppenebene erstellen zu lassen und dann die Prognosen für jedes SKU manuell aufzuteilen, da durch die Aufteilung selbst wahrscheinlich ein signifikanter Prognosefehler eingeführt wird. Intern setzt Lokad auf viele Aggregations-/Disaggregationsalgorithmen, und wir nutzen in der Regel die feinst granulierten verfügbaren Daten. Zum Beispiel nutzen wir tägliche Umsatzdaten, um monatliche Prognosen zu liefern. Tatsächlich kann ein Monat mit 4 oder 5 Wochenenden kommen, was die meisten Einzelhandelsunternehmen erheblich beeinflusst. Wie üblich müssen Sie sich keine Gedanken über das Aggregationsniveau machen, Lokad erfüllt Ihre Anforderungen.