Time Series Forecasting in SAP Analytics
Time Series Forecasting ermöglicht es, sichere Entscheidungen durch Zeitreihen- und Prognoseverfahren zu treffen. Daten aus Zeitreihen enthalten einen Wert über die Zeit, z.B. Umsatz nach Monat oder Anrufvolumen nach Woche.
In der SAP Analytics Cloud können Sie auf einfache Weise eine Prognose zu einem Zeitreihendiagramm, Liniendiagramm oder einer Planversion hinzufügen.
Dieser Blog erläutert die Funktionsweise des Time Series Forecasting in SAP Analytics Cloud und beantwortet häufig gestellte Fragen.
Anwendung in der SAP Analytics Cloud
Um eine Prognose zu einer Tabelle hinzuzufügen, müssen Sie lediglich die Prognose-Option auswählen. Die verfügbaren Optionen unterscheiden sich je nach Diagrammtyp, diese Unterschiede werden im Folgenden beschrieben.
Anhand einer Zeitreihe, einem Liniendiagramm oder einem Planungsraster, kann der Benutzer zwischen verschiedenen Techniken wählen, welche ihm bei der Entscheidungsfindung helfen (Automatic Forecast, Triple Exponential Smoothing und Linear Regression).
Da die Linear Regression und die Triple Exponential Smoothing Standardtechniken sind, konzentrieren wir uns hier auf das Automatic Forecasting.
Das automatische Time Series Forecasting der SAP Analytics Cloud führt erweiterte statistische Analysen durch, um Prognosen zu erstellen, indem sie Trends, Schwankungen und Saisonalität analysiert. Time Series Forecasting nutzt die von SAP entwickelte Zeitreihentechnologie zur Analyse historischer Zeitreihendaten.
Die Technologie hinter der automatischen Prognose
Der Algorithmus analysiert die historischen Daten, um die vorhandenen Muster zu identifizieren. Unter Verwendung dieser Muster werden die zukünftigen Werte projiziert. Das Schema analysiert verschiedene Komponenten für mehrere Daten.
- Die Daten werden für einen zugrunde liegenden Trend analysiert, es wird geschaut, ob die Daten, im Laufe der Zeit nach oben oder unten tendieren und ob dieser Trend linear oder polynomial ist. Ein linearer Trend steigt oder sinkt entlang einer Linie, ein polynomialer Trend folgt einer Kurve.
- Die zweite Komponente, die identifiziert wurde, sind Zyklen in den Daten, welche sich alle 10 Tage, alle 3 Monate, jedes Jahr zu Weihnachten oder am Ende des Geschäftsjahres wiederholen. In den Daten kann mehr als ein Zyklus identifiziert werden.
- Schließlich werden Trend und Zyklen berücksichtigt, um die restlichen Daten zu analysieren und ein Muster gefunden werden kann.
Der Algorithmus findet nicht alle drei Komponenten in den Daten, oft werden ein oder zwei der Komponenten erkannt und diese zur Erstellung von Prognosen verwendet. Der Algorithmus benutzt, die in den Daten gefundenen Muster, um die Werte von Time Series Forecasting vorherzusagen.
Eine technischere Beschreibung des Algorithmus ist, dass das Signal wie folgt in additive Komponenten zerlegt wird:
Signal = Trend + Zyklen + saisonale Komponente + Restwert
Das Tool wertet automatisch verschiedene Kombinationen von Trends, Zyklen und Schwankungen aus. Schließlich wählt es die Kombination aus, die die beste Vorhersagegenauigkeit bietet. Der Gesamtprozess ist in der folgenden Abbildung dargestellt:
Qualität der Prognose
Damit Sie eine Entscheidung sicher auf eine Prognose stützen können, müssen Sie die Qualität der Prognose verstehen. Die Qualität der Prognose wird auf zwei leicht verständliche Arten dargestellt.
Diese Qualität von Time Series Forecasting wird in Form einer einfachen Bewertung von 0 bis 5 ausgedrückt, wobei 5 eine sehr gute Prognose ist. Die Qualität kann durch Anklicken des “Forecast”-Links im Diagramm eingesehen werden. In Abbildung 3 sind die Details der Prognose dargestellt, wo die 5/5 Bewertung ist zu sehen. Sie sehen, dass die Qualität in diesem Fall als sehr hoch ist.
Das Rating von 0 bis 5 basiert auf einem statistischen Standardqualitätsmaß der Prognose – das Mean Absolute Percentage Error (MAPE). MAPE wird als Wert zwischen 0 und 1 ausgedrückt, wobei eine qualitativ hochwertige Prognose vom MAPE nahe 0 aufweist. Die Zuordnung von MAPE zu unserer Bewertung lautet wie folgt:
Zusätzlich zur Modellqualität stellt man ein Konfidenzintervall bereit, das der Ober- und Untergrenze, in Bezug auf den prognostizierten Wert (dargestellt als schattierter Bereich) entspricht.
Der prognostizierte Wert ist eine Punkteschätzung für einen bestimmten Zeitraum, z.B. der Umsatz für Januar. Die Breite des Konfidenzintervalls, welches die obere und untere Erwartung für den prognostizierten Wert bietet, ist doppelt so groß wie der Standardfehler der prognostizierten Werte. Standardmäßig verwendet man das 95%-Konfidenzintervall, so dass der Benutzer zu 95% sicher sein kann, dass der Istwert innerhalb des Intervalls liegt.
Ein enger Vertrauensbereich deutet auf einen kleineren möglichen Wertebereich, um den vorhergesagten Wert, und damit auf eine zuversichtlichere Prognose hin.
Möglichkeiten Time Series Forecasting anzupassen
Bei der Erstellung einer Prognose können Sie zwischen mehreren Optionen wählen.
Für das Time Series Forecasting in der SAP Analytics Cloud stehen drei Algorithmen zur Verfügung: Automatic Forecast, Linear Regression und Triple Exponential Smoothing.
- Automatic Forecast ist ein Prozess, der mehrere Algorithmen und Modelle auswertet und ein kombiniertes Modell verwendet, das wie oben beschrieben am besten funktioniert.
- Die lineare Regression bewirkt, dass das Modell eine lineare Regression der Zeit ist.
- Tripple Exponential Smooting treibt das Modell dazu, die Parameter, die den Algorithmus steuern, automatisch anzupassen, um den Fehler zu minimieren.
Es stehen zwei zusätzliche Prognosemöglichkeiten zur Verfügung: Prognoseperioden und zusätzliche Prognoseinformationen.
Mit Hilfe von Prognoseperioden, können Sie die Zeiträume festlegen, für die Sie eine Prognose erstellen möchten. Um eine nützliche Prognose zu ermöglichen, begrenzen wir die Anzahl der verfügbaren Prognosen, basierend auf den tatsächlichen Daten. Die Anzahl der angebotenen Vorhersagen wird wie folgt berechnet.
Wenn beispielsweise monatliche Verkaufszahlen für 48 Monate gegeben sind, ist die Anzahl der angebotenen Prognosen: (48 – 8) ÷ 4 = 10
Der Algorithmus vom automatischen Time Series Forecasting verwendet zusätzliche Prognoseeingaben, um die Genauigkeit der Vorhersage zu verbessern. Dabei handelt es sich um berechnete Kennzahlen, Messwerteingangskontrollen oder zusätzliche Kennzahlen, aus Ihrem Datenmodell, die Sie bei der Erstellung einer Prognose berücksichtigen möchten. Die Möglichkeit, zusätzliche Eingänge zu verwenden, ist nur bei Zeitreihendiagrammen gegeben. Die Werte für ausgewählte Kennzahlen müssen für vergangene Perioden und für die zukünftigen Perioden, bei der Sie eine Prognose durchführen möchten, verfügbar sein. Zusätzliche Prognoseinputs können die Genauigkeit der Prognose verbessern, das ist aber nicht immer der Fall.
Welche Datenquellen werden unterstützt?
Die Unterstützung der Datenquellen variiert je nach Nutzung der Funktionen. Die folgende Tabelle fasst dies zusammen: