Prognose mittels Deep Learning (2018)

Als Teil unseres grundlegenden Engagements, die genauesten Prognosen zu liefern, die die Technologie hervorbringen kann, freuen wir uns, bekannt zu geben, dass unser 5. Generation Prognosemotor jetzt bei Lokad live ist. Dieser Motor bringt die größte Genauigkeitsverbesserung, die wir jemals in einem einzigen Release erreichen konnten.

Von probabilistischer Prognose zu Deep Learning

power-clouds
Das Design des Motors basiert auf einer relativ neuen Art des maschinellen Lernens namens Deep Learning. Für Lieferketten können große Verbesserungen der Prognosegenauigkeit zu ebenso großen Renditen führen, indem mehr Kunden bedient werden, schneller bedient werden und dabei weniger Lagerbestandsrisiken eingegangen werden. Vor etwa 18 Monaten haben wir die 4. Generation unserer Prognosetechnologie angekündigt. Die 4. Generation war die erste, die echte probabilistische Prognosen lieferte. Probabilistische Prognosen sind in Lieferketten unerlässlich, da die Kosten auf den statistischen Extremen konzentriert sind, wenn die Nachfrage unerwartet hoch oder niedrig ist. Im Gegensatz dazu sind traditionelle Prognosemethoden - wie traditionelle tägliche, wöchentliche oder monatliche Prognosen - die nur darauf abzielen, Median- oder Durchschnittsprognosen zu liefern, blind für das Problem. Als Folge davon versagen diese Methoden in der Regel darin, zufriedenstellende Renditen für Unternehmen zu liefern. Die 5. Generation leugnet nicht ihre Ursprünge; sie umfasst auch probabilistische Prognosen und baut auf den Erfahrungen der vorherigen Generation auf.

Es stellt sich teilweise zufällig heraus, dass Deep Learning sich von Design her stark auf probabilistische Prognosen konzentriert. Die Motivation für diese Perspektive war jedoch vollständig unabhängig von Lieferkettenanliegen. Deep Learning-Algorithmen bevorzugen Optimierungen, die auf einer probabilistischen / Bayes’schen Perspektive basieren, mit Metriken wie Kreuzentropie, da diese Metriken enorme Gradientenwerte liefern, die besonders für den stochastischen Gradientenabstieg geeignet sind, dem “einen” Algorithmus, der Deep Learning ermöglicht.

Im speziellen Fall von Lieferketten stellt sich heraus, dass die Grundlagen des Deep Learning vollständig mit den tatsächlichen Geschäftsanforderungen übereinstimmen!

Jenseits des Hypes der künstlichen Intelligenz

Künstliche Intelligenz - in der Praxis durch Deep Learning betrieben - war das Schlagwort des Jahres 2017. Die Behauptungen sind kühn, faszinierend und nun ja, vage. Aus Lokads Perspektive beobachten wir, dass die Mehrheit dieser Unternehmens-KI-Technologien nicht den Erwartungen gerecht wird. Nur sehr wenige Unternehmen können über eine halbe Milliarde USD an Finanzierung sichern, wie Instacart, um ein erstklassiges Deep Learning-Team zusammenzustellen, um erfolgreich eine Herausforderung in der Lieferkette anzugehen.

Mit diesem Release macht Lokad AI-Grade Prognosetechnologie für jedes vernünftigerweise “digitalisierte” Unternehmen zugänglich. Offensichtlich wird das Ganze immer noch von historischen Lieferketten-Daten unterstützt, sodass die Daten für Lokad zugänglich sein müssen, aber unsere Technologie erfordert keinerlei Expertise im Bereich Deep Learning. Im Gegensatz zu praktisch jeder einzelnen “Unternehmens”-KI-Technologie verlässt sich Lokad nicht auf manuelles Feature Engineering. Soweit es unsere Kunden betrifft, wird der Wechsel von unseren bisherigen probabilistischen Prognosen zu Deep Learning nahtlos sein. Lokad ist das erste Softwareunternehmen, das eine schlüsselfertige AI-Grade Prognosetechnologie bereitstellt, die sowohl für winzige 1-Mann-E-Commerce-Unternehmen zugänglich ist als auch für die größten Lieferkettennetzwerke, die Tausende von Standorten und eine Million Produktreferenzen umfassen können.

Das Zeitalter des GPU-Computings

power-clouds Deep Learning blieb bis die Gemeinschaft ihre eigenen Software-Bausteine aufgerüstet hat, um von GPUs (Grafikprozessoren) zu profitieren, eher eine Nische. Diese GPUs unterscheiden sich stark von CPUs (Zentralprozessoren), die immer noch die überwiegende Mehrheit der Apps heutzutage antreiben, mit den bemerkenswerten Ausnahmen von Computerspielen, die intensiv sowohl auf CPUs als auch auf GPUs angewiesen sind. Neben der vollständigen Neuschreibung unseres Prognosemotors für diese 5. Iteration haben wir auch die Infrastruktur von Lokad auf niedriger Ebene erheblich verbessert. Tatsächlich nutzt die Lokad-Plattform jetzt GPUs sowie CPUs, um Unternehmen zu bedienen. Lokad nutzt jetzt die von Microsoft Azure unterstützte Cloud-Computing-Plattform, die Lokad unterstützt. Durch die massive Rechenleistung der GPUs machen wir nicht nur unsere Prognosen genauer, sondern auch viel schneller. Durch ein Raster von GPUs erhalten wir jetzt typischerweise die Prognosen etwa 3x bis 6x schneller, für jede umfangreiche Datensätze (*).

(*) Für ultrakleine Datensätze ist unser Prognosemotor der 5. Generation tatsächlich langsamer und benötigt einige Minuten mehr - was in der Praxis weitgehend unerheblich ist.

Produktstarts und Promotionen

Unser Prognosemotor der 5. Generation bringt erhebliche Verbesserungen in schwierigen Prognosesituationen, insbesondere bei Produktstarts und Promotionen. Aus unserer Sicht sind Produktstarts, obwohl sehr schwierig, etwas einfacher als Prognosen für Promotionen. Der Unterschied in der Schwierigkeit wird durch die Qualität der historischen Daten bestimmt, die für Promotionen im Vergleich zu Produktstarts zwangsläufig niedriger ist. Die Qualität der Promotionendaten verbessert sich im Laufe der Zeit, sobald die entsprechenden Qualitätskontrollprozesse implementiert sind.

Insbesondere sehen wir Deep Learning als eine massive Chance für Modemarken, die mit Produktstarts kämpfen, die ihren Umsatz dominieren: Das Starten eines neuen Produkts ist nicht die Ausnahme, sondern die Regel. Wenn dann Farb- und Größenvarianten die Anzahl der SKUs erheblich erhöhen, wird die Situation noch komplexer.

Unsere Prognose-FAQ

Welche Prognosemodelle verwenden Sie?

Unser tiefes Prognosemodell verwendet ein einziges Modell, das auf Deep-Learning-Prinzipien aufgebaut ist. Im Gegensatz zu klassischen statistischen Modellen handelt es sich um ein Modell, das über zehn Millionen trainierbare Parameter verfügt, was etwa 1000-mal mehr Parameter sind als unser vorheriges, komplexestes, nicht-tiefes maschinelles Lernmodell. Deep Learning übertrifft ältere maschinelle Lernansätze (zufällige Wälder, Gradienten-Boosting-Bäume) dramatisch. Es ist jedoch erwähnenswert, dass diese älteren maschinellen Lernansätze bereits die gesamte Zeitreihenklassiker (Box-Jenkins, ARIMA, Holt-Winters, exponentielle Glättung usw.) übertroffen haben.

Lernen Sie aus Ihren Prognosefehlern?

Ja. Der statistische Schulungsprozess - der letztendlich das Deep-Learning-Modell generiert - nutzt alle historischen Daten, die Lokad zur Verfügung stehen. Die historischen Daten werden durch einen Prozess namens Backtesting genutzt. Je mehr historische Daten dem Modell zur Verfügung stehen, desto mehr Möglichkeiten hat das Modell, aus seinen eigenen Fehlern zu lernen.

Ja, der Prognosemotor behandelt alle gängigen Zyklen und sogar die quasi-zyklischen Phänomene, deren Bedeutung häufig unterschätzt wird. Was den Code betrifft, verwendet das Deep-Learning-Modell intensiv einen mehrfachen Zeitreihenansatz, um die beobachteten Zyklen in anderen Produkten zu nutzen, um die Prognosegenauigkeit eines einzelnen Produkts zu verbessern. Natürlich können zwei Produkte dieselbe Saisonalität teilen, aber nicht das gleiche Wochentagsmuster. Das Modell ist in der Lage, dieses Muster zu erfassen. Einer der großen Vorteile des Deep Learning ist auch die Fähigkeit, die Variabilität der Saisonalität selbst richtig zu erfassen. Tatsächlich kann eine Saison früher oder später beginnen, abhängig von externen Variablen wie dem Wetter, und diese Variationen werden in unseren Prognosen erkannt und widergespiegelt.

Welche Daten benötigen Sie?

Wie bereits bei unserer vorherigen Generation von Prognosetechnologie benötigt der Prognosemotor zur Vorhersage der Nachfrage mindestens die tägliche historische Nachfrage, und eine disaggregierte Auftragsgeschichte ist noch besser. Was die Länge der Historie betrifft - je länger sie ist, desto besser. Während mit weniger als 2 Jahren Geschichte keine Saisonalität erkannt werden kann, halten wir 3 Jahre Geschichte für gut und 5 Jahre für ausgezeichnet. Um die Vorlaufzeiten vorherzusagen, benötigt der Motor in der Regel, dass die Bestellungen sowohl die Bestelldaten als auch die Lieferdaten enthalten. Die Angabe Ihrer Produkt- oder SKU-Eigenschaften hilft auch erheblich, die Prognosen zu verfeinern. Darüber hinaus ist es auch sehr hilfreich, Ihre Lagerbestände bereitzustellen, um eine erste aussagekräftige Lageranalyse zu erhalten.

Können Sie meine Excel-Tabelle prognostizieren?

Als Faustregel gilt: Wenn alle Ihre Daten in eine Excel-Tabelle passen, können wir in der Regel nicht viel für Sie tun, und ehrlich gesagt kann das auch niemand. Tabellendaten werden wahrscheinlich pro Woche oder pro Monat aggregiert, und die meisten historischen Informationen gehen durch eine solche Aggregation verloren. In diesem Fall enthält Ihre Tabelle auch nicht viele Informationen über die Kategorien und Hierarchien, die für Ihre Produkte gelten. Unser Prognosemotor nutzt alle verfügbaren Daten, und ein Test an einer winzigen Stichprobe wird keine zufriedenstellenden Ergebnisse liefern.

Was ist mit Lagerausfällen und Promotionen?

Sowohl Lagerausfälle als auch Promotionen stellen eine Verzerrung der historischen Verkäufe dar. Da das Ziel darin besteht, die Nachfrage und nicht den Umsatz vorherzusagen, muss diese Verzerrung berücksichtigt werden. Eine häufige - aber falsche - Methode, mit diesen Ereignissen umzugehen, besteht darin, die Geschichte umzuschreiben, um Lücken zu füllen und Spitzen zu kappen. Wir mögen jedoch diesen Ansatz nicht, weil er darin besteht, Prognosen dem Prognosemotor zuzuführen, was zu erheblichen Überanpassungsproblemen führen kann. Stattdessen unterstützt unser Motor nativ “Flags”, die anzeigen, wo die Nachfrage zensiert oder aufgebläht wurde.

Prognostizieren Sie neue Produkte?

Ja, das tun wir. Um jedoch neue Produkte vorherzusagen, benötigt der Motor die Startdaten für die anderen “älteren” Produkte sowie ihre historische Nachfrage zum Zeitpunkt des Starts. Auch die Angabe einiger Ihrer Produktkategorien und/oder einer Produkt-Hierarchie wird empfohlen. Der Motor prognostiziert in der Tat neue Produkte, indem er die “älteren” Produkte automatisch erkennt, die als vergleichbar mit den neuen angesehen werden können. Da jedoch noch keine Nachfrage für die neuen Artikel beobachtet wurde, stützen sich die Prognosen vollständig auf die damit verbundenen Attribute.

Verwenden Sie externe Daten, um die Prognosen zu verfeinern?

Wir können Wettbewerbspreisdaten verwenden, die in der Regel von Drittanbietern stammen, die sich beispielsweise auf Web-Scraping spezialisiert haben. Auch Web-Traffic-Daten können genutzt und möglicherweise erworben werden, um die historischen Daten zu bereichern und die statistische Genauigkeit weiter zu steigern. In der Praxis liegt der größte Engpass bei der Verwendung externer Datenquellen nicht am Lokad-Prognosemotor - der ziemlich leistungsfähig ist - sondern am Einrichten und Aufrechterhalten einer hochwertigen Datenpipeline, die an diese externen Datenquellen angeschlossen ist.