Régression quantile
La régression quantile est un type de régression (c.-à-d. prévision) qui introduit volontairement un biais dans le résultat. Au lieu de rechercher la moyenne de la variable à prédire, une régression quantile recherche la médiane et tous les autres quantiles (parfois appelés percentiles). Les quantiles sont particulièrement utiles pour l’optimisation de stocks comme méthode directe pour calculer le point de commande.
La notion de régression quantile est un sujet statistique relativement avancé, l’objectif de cet article n’est pas d’en faire un traitement rigoureux, mais plutôt de fournir une introduction (relativement) intuitive au sujet pour les praticiens du commerce de détail ou de la fabrication.
Illustration visuelle des quantiles

Le graphique ci-dessus illustre 3 prévisions distinctes :
- en rouge, une prévision quantile à 75%.
- en noir, une prévision moyenne.
- en vert, une prévision quantile à 25%.
Visuellement, les quantiles se comportent à peu près comme des intervalles de confiance. Toutefois, en pratique, le quantile n’est nécessaire que pour un pourcentage cible unique.
Quantiles (ou percentiles) de la demande future
La prévision classique, et la plus intuitive, est la prévision moyenne : les poids respectifs de la surestimation et de la sous-estimation devraient être égaux, sinon la prévision est biaisée (plus précisément biaisée contre la moyenne).
Un premier affinage de cette vision est la prévision médiane : la fréquence respective de la surestimation et de la sous-estimation devrait être égale, sinon la prévision est biaisée contre la médiane.
À ce stade, nous avons déjà déplacé la notion de prévisions non biaisées des poids égaux vers des chances égales. Ce changement est subtil, mais dans certaines situations, il peut avoir un grand impact numérique.
Illustration : revenu moyen vs médian des ménages aux États-Unis
Le revenu des ménages illustre la différence profonde entre la moyenne et la médiane.
Cet écart s’explique par les revenus élevés (comparativement) des ménages américains les plus riches par rapport au reste de la population. Un tel écart entre la moyenne et la médiane se retrouve dans toutes les distributions qui ne sont pas symétriques, typiquement dans toutes les distributions qui ne suivent pas une distribution normale.
Généralisation de la médiane
La médiane représente le seuil où la distribution est divisée en chances de 50/50. Cependant, il est possible d’envisager d’autres ratios de fréquences. Par exemple, nous pouvons envisager 80/20 ou 90/10 ou tout autre ratio où le total reste à 100%.
Les quantiles représentent une généralisation de la médiane à n’importe quel pourcentage donné. Pour τ, une valeur comprise entre 0 et 1, la régression quantile Q(τ) représente le seuil où la probabilité d’observer une valeur inférieure au seuil est exactement τ.
Prévisions quantiles
Les prévisions classiques et quantiles prennent toutes deux une série temporelle comme entrée. La série temporelle représente les données d’entrée. En plus des données, une prévision de série temporelle classique moyenne nécessite deux réglages structurels supplémentaires :
- la période, telle que jour, semaine ou mois.
- l’horizon, un entier représentant le nombre de périodes à prévoir.
Implicitement, la série temporelle est agrégée selon la période, et l’horizon est choisi suffisamment grand pour être utile en pratique, typiquement supérieur au lead time.
Les prévisions moyennes bénéficient d’une propriété très pratique : il est mathématiquement correct de sommer les prévisions. Par exemple, si y1, y2, y3 et y4 représentent la prévision des 4 prochaines semaines, alors si nous avons besoin de la demande attendue uniquement pour les deux prochaines semaines, nous pouvons additionner y1+y2.
Cependant, additionner des prévisions quantiles est mathématiquement incorrect, ou plus précisément, la somme des quantiles ne donne pas le quantile de la somme (somme des segments).
Puisque les prévisions quantiles ne peuvent être additionnées, les prévisions de séries temporelles quantiles doivent reconsidérer la notion même d’agrégation par période. En effet, produire des prévisions quantiles par période est vain, car ces prévisions élémentaires ne peuvent être combinées pour produire des quantiles corrects sur des segments.
Ainsi, la prévision de série temporelle quantile adopte une structure distincte :
- τ, le quantile ciblé, un pourcentage.
- λ, l’horizon exprimant une durée (typiquement en jours).
Par exemple, si la série temporelle représente les ventes d’un produit A, et que nous avons les réglages τ=0,90 et λ=14 jours, alors la prévision quantile (τ, λ) retournera la valeur de la demande qui a exactement 90 % de chances d’être supérieure à la demande totale observée sur 14 jours (et respectivement 10 % de chances d’être inférieure à la demande sur ces mêmes 14 jours).
Contrairement aux prévisions classiques, les prévisions quantiles produisent une et une seule valeur par série temporelle, indépendamment de l’horizon. Dans une certaine mesure, les prévisions quantiles sont moins dépendantes de la période que leurs homologues classiques.
Le piège de Lokad
À première vue, les prévisions quantiles semblent un peu plus compliquées que les prévisions classiques. Néanmoins, dans de nombreuses situations réelles, les praticiens finissent par produire d’abord des prévisions moyennes afin de les extrapoler immédiatement en prévisions quantiles, partant généralement du principe que les prévisions suivent une distribution normale. Toutefois, cette étape d’extrapolation représente fréquemment le maillon faible du processus et peut dégrader significativement le résultat final. La technologie de prévision devrait s’adapter aux exigences pratiques, c’est-à-dire fournir des prévisions quantiles natives, et non l’inverse.
Pour aller plus loin
- Point de commande, comment les quantiles s’appliquent à l’optimisation de stocks.
- Fonction de perte flippeur, comment mesurer la précision des prévisions d’une prévision quantile.
- Roger Koenker, Kevin F. Hallock, (2001) Régression quantile, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Estimation non paramétrique des quantiles, Journal of Machine Learning Research 7 1231–1264