Mit 20 Millionen Bäumen zu einer neuen Inflationsprognose

Wir stellen ein neues, kraftvolles Inflationsmodell für den Euroraum vor.

people___profile_24_outline
Dr. Vincent Stamer

Commerzbank Economic Research

16. August 2024

Das neue Modell basiert unter anderem auf der Methode der "Random Forests" aus dem Bereich des maschinellen Lernens. Es verarbeitet eine große Datenmenge und schätzt die Komponenten der Inflation zwölf Monate im Voraus. Das neue Prognosemodell zeigt beispielsweise für das kommende Jahr ein Aufwärtsrisiko bei den Warenpreisen an. Die Inflation dürfte im kommenden Jahr über 2% liegen.

Ein neues Prognosemodell eröffnet neue Möglichkeiten

Der Ukrainekrieg und die Lieferkettenkrise ließen die Inflation im Euroraum 2022 sprunghaft ansteigen – in der Spitze auf über 10%. Prognosemodelle hatten das nicht vorhersagen können – auch weil es in den Jahren zuvor kaum eine Bewegung in der Inflation gab und Modelle die starke Erhöhung der Energiepreise und die Lieferkettenprobleme nicht korrekt einordnen konnten. Nun stehen uns einerseits mehr Daten und andererseits bessere Methoden zur Verfügung. Daher haben wir ein neues, kraftvolles Inflationsmodell entwickelt, das Techniken aus dem Bereich des maschinellen Lernens verwendet und eine große Datenmenge verarbeitet.

Random Forests in der Inflationsprognose trotzen der Datenmenge

Wir haben ein rein datengetriebenes Inflationsmodell auf dem neuesten Stand der Forschung entwickelt. Während ein Economic Insight alle Berechnungsschritte im Detail erläutert, fasst der folgende Abschnitt die wichtigsten Schritte und Techniken zusammen: Im Kern kombiniert das neue Prognosemodell ein Auswahlverfahren aus der Statistik und eine Methode des maschinellen Lernens, die sich in ähnlicher Form in der Forschung ( siehe Studie ) bewährt haben. Diese Kombination der Techniken erlaubt die Verarbeitung besonders vieler Indikatoren und bezieht ungewöhnliche Bewegungen der Daten ein wie Sprünge zwischen Inflationsniveaus.

Zunächst wählt ein Selektionsverfahren (Least Absolute Shrinkage and Selection Operator, LASSO) aus bis zu 75 Zeitreihen die für die Inflationsprognose wichtigsten Reihen heraus und entscheidet, mit welcher zeitlichen Verzögerung sie in die Prognose eingehen. Die so ausgewählten Daten fließen in ein Random Forest-Modell (RF) ein. Dieser Algorithmus aus dem Bereich des maschinellen Lernens gründet auf dem Prinzip eines Entscheidungsbaums: Die Monate der letzten zwanzig Jahre werden in diesem Entscheidungsbaum je nach Höhe der die Inflation erklärenden Variablen (etwa Löhne oder Ölpreise) in Gruppen einsortiert und die durchschnittliche Inflation dieser Gruppe ausgerechnet. Ein neuer, zukünftiger Monat wird dann entsprechend der gelernten Einordnung in eine bestehende Gruppe einsortiert. Der historische Inflationsdurchschnitt dieser Gruppe dient dann als Prognose für den neuen Monat. Der "Lerneffekt" der Maschine besteht darin, dass eine enorme Zahl dieser Entscheidungsbäume in unterschiedlichen Kombinationen der Indikatoren geschätzt werden – in unserem Fall etwa 20 Millionen pro Durchlauf. Das Ergebnis eines Durchlaufs sind Prognosen für die Preisentwicklung der vier Komponenten der Inflation: Energie, Nahrungs- und Genussmittel, Waren ohne Energie, sowie Dienstleistungen. Der Fokus auf Inflationskomponenten erlaubt uns, spezifische Input-Zeitreihen wie beispielsweise den Ölpreis und die Produzentenpreise für Vorleistungen zielgerichtet zur Prognose der Energie- bzw. Warenkomponente der Inflation einzusetzen.

Den vollständigen Text finden Sie im PDF-Dokument.