Quantilsregression

learn menu
Von Joannès Vermorel, Februar 2012

Die Quantilsregression ist eine Art von Regression (d.h. Prognose), die absichtlich eine Verzerrung im Ergebnis einführt. Anstatt den Durchschnitt der zu prognostizierenden Variable zu suchen, sucht eine Quantilsregression das Median und andere Quantile (manchmal auch Prozentränge genannt). Quantile sind besonders nützlich für die Bestandsoptimierung als direkte Methode zur Berechnung des Wiederbeschaffungspunkts.

Regression ist hier ein Synonym für Prognose. “Regression” betont den mathematischen Ansatz, während “Prognose” die praktische Verwendung des Ergebnisses betont.

Der Begriff der Quantilsregression ist ein relativ fortgeschrittenes statistisches Thema. Das Ziel dieses Artikels ist es nicht, eine strenge Behandlung dieses Themas vorzunehmen, sondern vielmehr eine (relativ) intuitive Einführung in das Thema für Praktiker im Einzelhandel oder in der Fertigung zu geben.

Visuelle Darstellung von Quantilen

Die unteren und oberen Quantil-Zeitreihen nebeneinander mit der Durchschnittsprognose-Zeitreihe.

Das obige Diagramm veranschaulicht 3 verschiedene Prognosen:

  • in Rot eine 75% Quantilprognose.
  • in Schwarz eine Durchschnittsprognose.
  • in Grün eine 25% Quantilprognose.

Visuell verhalten sich Quantile ziemlich ähnlich wie Konfidenzintervalle. In der Praxis wird das Quantil jedoch nur für einen einzigen Zielprozentsatz benötigt.

Quantile (oder Prozentränge) der zukünftigen Nachfrage

Die klassische und intuitivste Prognose ist die Durchschnittsprognose: die jeweiligen Gewichte der Überprognose und der Unterprognose sollten gleich sein, sonst ist die Prognose verzerrt (genauer gesagt verzerrt gegen den Durchschnitt).

Obwohl eine unverzerrte Prognose eine wünschenswerte Eigenschaft ist, sagt sie nichts über die Genauigkeit der Prognose aus. Insbesondere kann eine Prognose sowohl unverzerrt als auch weitgehend ungenau sein. Die Verzerrung bezieht sich nur auf die Neigung des Prognosemodells, die Zukunft zu überschätzen oder zu unterschätzen.

Eine erste Verfeinerung dieser Sichtweise ist die Medianprognose: die jeweilige Häufigkeit der Überprognose und der Unterprognose sollte gleich sein, sonst ist die Prognose verzerrt gegen den Median.

An diesem Punkt haben wir die Vorstellung von unverzerrten Prognosen bereits von gleichen Gewichten zu gleichen Wahrscheinlichkeiten verschoben. Diese Verschiebung ist subtil, kann aber in einigen Situationen eine große numerische Auswirkung haben.

Veranschaulichung: Durchschnittliches vs. Median-Haushaltseinkommen in den USA

Das Haushaltseinkommen veranschaulicht den tiefgreifenden Unterschied zwischen Durchschnitt und Median.

Laut dem US Census Bureau betrug das durchschnittliche Haushaltseinkommen im Jahr 2004 44.389 US-Dollar, während im selben Jahr das Median (Durchschnitts-)Einkommen 60.528 US-Dollar betrug, fast 40% höher als der Median.

Diese Diskrepanz erklärt sich durch die hohen Einkommen (vergleichsweise) der reichsten US-Haushalte im Vergleich zum Rest der Bevölkerung. Eine solche Diskrepanz zwischen Durchschnitt und Median findet sich in allen Verteilungen, die nicht symmetrisch sind, typischerweise in allen Verteilungen, die keiner Normalverteilung folgen.

Verallgemeinerung des Medians

Der Median repräsentiert den Schwellenwert, bei dem die Verteilung zu gleichen Teilen aufgeteilt ist. Es ist jedoch möglich, andere Häufigkeitsverhältnisse zu betrachten. Zum Beispiel können wir 80/20 oder 90/10 oder andere Verhältnisse betrachten, bei denen die Gesamtsumme bei 100% bleibt.

Quantile stellen eine Verallgemeinerung des Medians für einen beliebigen Prozentsatz dar. Für τ, einen Wert zwischen 0 und 1, repräsentiert die Quantilregression Q(τ) den Schwellenwert, bei dem die Wahrscheinlichkeit, einen Wert niedriger als der Schwellenwert zu beobachten, genau τ beträgt.

Quantile Prognosen

Sowohl klassische als auch Quantilprognosen verwenden eine Zeitreihe als Eingabe. Die Zeitreihe repräsentiert die Eingabedaten. Zusätzlich zu den Daten erfordert eine klassische Durchschnitts Zeitreihenprognose zwei zusätzliche strukturelle Einstellungen:

  • die Periode, wie Tag, Woche oder Monat.
  • der Horizont, eine ganze Zahl, die die Anzahl der zu prognostizierenden Perioden darstellt.

Implizit wird die Zeitreihe gemäß der Periode aggregiert, und der Horizont wird so gewählt, dass er praktisch nutzbar ist, typischerweise größer als die Lieferzeit.

Durchschnitts Prognosen profitieren von einer sehr praktischen Eigenschaft: es ist mathematisch korrekt, die Prognosen zu summieren. Wenn zum Beispiel y1, y2, y3 und y4 die Prognose für 4 Wochen im Voraus darstellen, dann können wir, wenn wir den erwarteten Bedarf nur für die nächsten zwei Wochen benötigen, y1+y2 summieren.

Das Summieren von Quantilprognosen ist jedoch mathematisch inkorrekt, genauer gesagt ergibt die Summe der Quantile nicht das Quantil der Summe (Summe der Segmente).

Lassen Sie uns veranschaulichen, warum Quantile nicht summiert werden können. Angenommen, wir haben einen Spieler, der jede Woche eine 1-Dollar-Münze in einen Spielautomaten wirft. Angenommen, die Gewinnchancen betragen 1% für einen Preis von 50 US-Dollar und sonst null. Wenn wir uns das 99%-Quantil der erwarteten Belohnung ansehen, haben wir jede Woche eine Belohnung von 50 US-Dollar. Wenn wir jedoch das 99%-Quantil über zwei Wochen betrachten, bleibt die erwartete Belohnung weiterhin bei 50 US-Dollar. Die Wahrscheinlichkeit, zweimal zu gewinnen, beträgt nur 0,01% (1% multipliziert mit 1%), daher bleibt das 99%-Quantil unverändert. Das Summieren der beiden 99%-wöchentlichen Quantile würde 100 US-Dollar ergeben, aber in Wirklichkeit dauert es 16 Wochen, um 100 US-Dollar Gewinn für das 99%-Quantil anzusammeln (der Beweis für dieses numerische Ergebnis wird nicht gegeben, da er über den Rahmen dieses Artikels hinausgeht).

Da Quantilprognosen nicht summiert werden können, müssen Quantil-Zeitreihenprognosen die grundlegende Idee der Periodenaggregation neu überdenken. Tatsächlich ist es sinnlos, pro Periode Quantilprognosen zu erstellen, da diese elementaren Prognosen nicht kombiniert werden können, um korrekte Quantile über Segmente zu erzeugen.

Daher weist die Quantil-Zeitreihenprognose eine besondere Struktur auf:

  • τ das angestrebte Quantil, in Prozent.
  • λ der Horizont, der eine Dauer angibt (typischerweise in Tagen).

Zum Beispiel, wenn die Zeitreihen den Verkauf eines Produkts A darstellen und wir die Einstellungen τ=0,90 und λ=14 Tage haben, dann gibt die Quantilprognose (τ, λ) den Nachfragewert zurück, der genau eine 90%ige Chance hat, größer zu sein als die beobachtete Gesamtnachfrage über 14 Tage (bzw. eine 10%ige Chance, niedriger zu sein als die Nachfrage über dieselben 14 Tage).

Im Gegensatz zu klassischen Prognosen erzeugen Quantilprognosen einen und nur einen Wert pro Zeitreihe, unabhängig vom Horizont. In gewisser Weise sind Quantilprognosen mehr periodenunabhängig als ihre klassischen Gegenstücke.

Lokads Tücke

Auf den ersten Blick scheinen Quantilprognosen etwas komplizierter zu sein als die klassischen. Dennoch produzieren Praktiker in vielen realen Situationen zunächst Mittelwert-Prognosen, um sie sofort als Quantilprognosen zu extrapolieren, wobei sie typischerweise annehmen, dass die Prognosen einer Normalverteilung folgen. Dieser Extrapolationsschritt stellt jedoch häufig das schwächste Glied des Prozesses dar und kann das Endergebnis erheblich beeinträchtigen. Die Prognosetechnologie sollte sich an die praktischen Anforderungen anpassen, d.h. native Quantilprognosen liefern und nicht umgekehrt.

Weitere Informationen