Die Quantilsregression ist eine Art von Regression (d.h. Prognose), die absichtlich eine Verzerrung im Ergebnis einführt. Anstatt den Durchschnitt der zu prognostizierenden Variable zu suchen, sucht eine Quantilsregression das Median und andere Quantile (manchmal auch Prozentränge genannt). Quantile sind besonders nützlich für die Bestandsoptimierung als direkte Methode zur Berechnung des Wiederbeschaffungspunkts.
Der Begriff der Quantilsregression ist ein relativ fortgeschrittenes statistisches Thema. Das Ziel dieses Artikels ist es nicht, eine strenge Behandlung dieses Themas vorzunehmen, sondern vielmehr eine (relativ) intuitive Einführung in das Thema für Praktiker im Einzelhandel oder in der Fertigung zu geben.
Visuelle Darstellung von Quantilen
Das obige Diagramm veranschaulicht 3 verschiedene Prognosen:
- in Rot eine 75% Quantilprognose.
- in Schwarz eine Durchschnittsprognose.
- in Grün eine 25% Quantilprognose.
Visuell verhalten sich Quantile ziemlich ähnlich wie Konfidenzintervalle. In der Praxis wird das Quantil jedoch nur für einen einzigen Zielprozentsatz benötigt.
Quantile (oder Prozentränge) der zukünftigen Nachfrage
Die klassische und intuitivste Prognose ist die Durchschnittsprognose: die jeweiligen Gewichte der Überprognose und der Unterprognose sollten gleich sein, sonst ist die Prognose verzerrt (genauer gesagt verzerrt gegen den Durchschnitt).
Eine erste Verfeinerung dieser Sichtweise ist die Medianprognose: die jeweilige Häufigkeit der Überprognose und der Unterprognose sollte gleich sein, sonst ist die Prognose verzerrt gegen den Median.
An diesem Punkt haben wir die Vorstellung von unverzerrten Prognosen bereits von gleichen Gewichten zu gleichen Wahrscheinlichkeiten verschoben. Diese Verschiebung ist subtil, kann aber in einigen Situationen eine große numerische Auswirkung haben.
Veranschaulichung: Durchschnittliches vs. Median-Haushaltseinkommen in den USA
Das Haushaltseinkommen veranschaulicht den tiefgreifenden Unterschied zwischen Durchschnitt und Median.
Diese Diskrepanz erklärt sich durch die hohen Einkommen (vergleichsweise) der reichsten US-Haushalte im Vergleich zum Rest der Bevölkerung. Eine solche Diskrepanz zwischen Durchschnitt und Median findet sich in allen Verteilungen, die nicht symmetrisch sind, typischerweise in allen Verteilungen, die keiner Normalverteilung folgen.
Verallgemeinerung des Medians
Der Median repräsentiert den Schwellenwert, bei dem die Verteilung zu gleichen Teilen aufgeteilt ist. Es ist jedoch möglich, andere Häufigkeitsverhältnisse zu betrachten. Zum Beispiel können wir 80/20 oder 90/10 oder andere Verhältnisse betrachten, bei denen die Gesamtsumme bei 100% bleibt.
Quantile stellen eine Verallgemeinerung des Medians für einen beliebigen Prozentsatz dar. Für τ, einen Wert zwischen 0 und 1, repräsentiert die Quantilregression Q(τ) den Schwellenwert, bei dem die Wahrscheinlichkeit, einen Wert niedriger als der Schwellenwert zu beobachten, genau τ beträgt.
Quantile Prognosen
Sowohl klassische als auch Quantilprognosen verwenden eine Zeitreihe als Eingabe. Die Zeitreihe repräsentiert die Eingabedaten. Zusätzlich zu den Daten erfordert eine klassische Durchschnitts Zeitreihenprognose zwei zusätzliche strukturelle Einstellungen:
- die Periode, wie Tag, Woche oder Monat.
- der Horizont, eine ganze Zahl, die die Anzahl der zu prognostizierenden Perioden darstellt.
Implizit wird die Zeitreihe gemäß der Periode aggregiert, und der Horizont wird so gewählt, dass er praktisch nutzbar ist, typischerweise größer als die Lieferzeit.
Durchschnitts Prognosen profitieren von einer sehr praktischen Eigenschaft: es ist mathematisch korrekt, die Prognosen zu summieren. Wenn zum Beispiel y1, y2, y3 und y4 die Prognose für 4 Wochen im Voraus darstellen, dann können wir, wenn wir den erwarteten Bedarf nur für die nächsten zwei Wochen benötigen, y1+y2 summieren.
Das Summieren von Quantilprognosen ist jedoch mathematisch inkorrekt, genauer gesagt ergibt die Summe der Quantile nicht das Quantil der Summe (Summe der Segmente).
Da Quantilprognosen nicht summiert werden können, müssen Quantil-Zeitreihenprognosen die grundlegende Idee der Periodenaggregation neu überdenken. Tatsächlich ist es sinnlos, pro Periode Quantilprognosen zu erstellen, da diese elementaren Prognosen nicht kombiniert werden können, um korrekte Quantile über Segmente zu erzeugen.
Daher weist die Quantil-Zeitreihenprognose eine besondere Struktur auf:
- τ das angestrebte Quantil, in Prozent.
- λ der Horizont, der eine Dauer angibt (typischerweise in Tagen).
Zum Beispiel, wenn die Zeitreihen den Verkauf eines Produkts A darstellen und wir die Einstellungen τ=0,90 und λ=14 Tage haben, dann gibt die Quantilprognose (τ, λ) den Nachfragewert zurück, der genau eine 90%ige Chance hat, größer zu sein als die beobachtete Gesamtnachfrage über 14 Tage (bzw. eine 10%ige Chance, niedriger zu sein als die Nachfrage über dieselben 14 Tage).
Im Gegensatz zu klassischen Prognosen erzeugen Quantilprognosen einen und nur einen Wert pro Zeitreihe, unabhängig vom Horizont. In gewisser Weise sind Quantilprognosen mehr periodenunabhängig als ihre klassischen Gegenstücke.
Lokads Tücke
Auf den ersten Blick scheinen Quantilprognosen etwas komplizierter zu sein als die klassischen. Dennoch produzieren Praktiker in vielen realen Situationen zunächst Mittelwert-Prognosen, um sie sofort als Quantilprognosen zu extrapolieren, wobei sie typischerweise annehmen, dass die Prognosen einer Normalverteilung folgen. Dieser Extrapolationsschritt stellt jedoch häufig das schwächste Glied des Prozesses dar und kann das Endergebnis erheblich beeinträchtigen. Die Prognosetechnologie sollte sich an die praktischen Anforderungen anpassen, d.h. native Quantilprognosen liefern und nicht umgekehrt.
Weitere Informationen
- Bestellpunkt, wie Quantile bei der Bestandsoptimierung angewendet werden.
- Pinball-Verlustfunktion, wie die Genauigkeit einer Quantilprognose gemessen wird.
- Roger Koenker, Kevin F. Hallock, (2001) Quantile Regression, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Nonparametric Quantile Estimation, Journal of Machine Learning Research 7 1231–1264