Autoregressive integrierte Moving Average ARIMA Modelle 1.Präsentation zum Thema Autoregressive Integrated Moving Durchschnittliche ARIMA Modelle 1 Präsentationstranskript.1 Autoregressive Integrierte Moving Average ARIMA Modelle 1.2 2 - Prognosetechniken basierend auf exponentieller Glättung - General Annahme für die oben genannten Modelle mal Seriendaten dargestellt werden als Die Summe zweier unterschiedlicher Komponenten deterministc wird in der absoluten Wertung nach der Verzögerung sehr klein. Erfassender Bewegender Durchschnittsprozess MA 1 Autokovarianz von MA q Autocorelation von MA q 19 q 1.20 20 - Mean nur endliche Anzahl von Störungen tragen zum aktuellen Wert bei Zeit-Serie - Berücksichtigen Sie alle Störungen der Vergangenheit verwenden autoregressive Modelle schätzen unendlich viele Gewichte, die einem deutlichen Muster mit einer kleinen Anzahl von Parametern folgen.24 Erste Ordnung Autoregressive Prozess, AR 1 Nehmen Sie die Beiträge der Störungen, die Weg in der Vergangenheit sind klein im Vergleich zu den jüngsten Störungen, die der Prozeß erlebt hat, reflektieren die abnehmenden Größen der Beiträge der Störungen der Vergangenheit durch den Satz von unendlich vielen Gewichten in absteigenden Größen, wie die Gewichte in den Störungen ausgehend von der aktuellen Störung und Rückkehr in der Vergangenheit 24 Exponentielles Zerfallmuster.25 Autorekorrektiver Prozeß der ersten Ordnung AR 1 AR 1 stationär wenn 25 wo WARUM AUTOREGRESSIV.26 Mittlerer AR 1 Autokovarianzfunktion AR 1 Autokorrelationsfunktion AR 1 26 Der ACF für einen stationären AR 1 - Verfahren hat eine exponentielle Verfall-Form.27 27 Beobachten - Die Beobachtungen zeigen nach unten Bewegungen.28 Zweite Ordnung Autoregressive Prozess, AR 2 28 Dieses Modell kann in der unendlichen MA Form Dämpfungsfaktor R Frequenzperiode dargestellt werden.36 36 Fall III eine reale Wurzel m 0 m 1 M 2 m 0 ACF bilden exponentielles Zerfallsmuster.37 37 AR 2 Prozess yt 4 0 4y t-1 0 5y t-2 et Wurzeln der polynomischen realen ACF bilden Mischung aus 2 exponentiellen Zerfallsbedingungen.38 38 AR 2 Prozess yt 4 0 8y t-1 -0 5y t-2 et Wurzeln der Polynomkomplex-Konjugate ACF bilden gedämpftes sinusförmiges Verhalten.39 39 Allgemeines Autoregressives Verfahren, AR p Betrachten Sie ein AR-Modell AR0 oder 400 AR P stationär Wenn die Wurzeln des Polynoms vorliegen Sind kleiner als 1 im absoluten Wert AR P absolut summierbare unendliche MA-Darstellung unter der vorherigen Bedingung.41 41 Gewichte der zufälligen Schocks as.42 42 Für stationäre AR S.43 43 ACF p-Ordnung lineare Differenzengleichungen AR p - erfüllt das Yule - Walker-Gleichungen - ACF können aus den p-Wurzeln des zugehörigen Polynoms gefunden werden, zB nicht unbedingt ein AR-Prozess - für jeden festen Wert k sind die Yule-Walker-Gleichungen für den ACF eines AR p Prozessklassenbildlinks uk-Text-groß Uk-margin-small-left uk-margin-small-right 47 47 Teilweise Autokorrelationsfunktion PACF zwischen yt nicht unbedingt ein AR-Prozess - Für jeden festen Wert k sind die Yule-Walker-Gleichungen für den ACF eines AR p-Prozesses p gleich Null Betrachten Sie - eine stationäre Zeitreihe, die nicht unbedingt ein AR-Prozess ist - für jeden festen Wert k, die Yule-Walker-Gleichungen für den ACF eines AR p-Prozesstitels 47 Teilautokorrelationsfunktion PACF zwischen yt nicht unbedingt ein AR-Prozess - für jeden festen Wert k, die Yule-Walker-Gleichungen für die ACF eines AR p-Prozesses.48 48 Matrix-Notationslösungen Für jeden gegebenen k, k 1,2 wird der letzte Koeffizient der partielle Autokorrelationskoeffizient des Prozesses bei Verzögerung k AR p-Prozeß genannt Identifizieren Sie die Reihenfolge eines AR-Prozesses mithilfe des PACF.49 49 Abschneiden nach 1 Verzögerung Abfallmuster AR 2 MA 1 MA 2 Abklingmuster AR 1 AR 2 Abschalt nach 2. Lag 50 50 Invertierbarkeit der MA-Modelle Invertierbarer gleitender Durchschnitt Prozess Der MA q Prozess ist invertierbar, wenn er eine absolut summierbare unendliche AR-Darstellung hat. Es kann gezeigt werden Die unendliche AR-Darstellung für MA q.51 51 Erhalten Wir brauchen Bedingung der Invertierbarkeit Die Wurzeln des zugehörigen Polynoms sind kleiner als 1 im absoluten Wert An Invertierbares MA q - Prozess kann dann als unendlicher AR-Prozess geschrieben werden.52 52 PACF eines MA q - Verfahrens ist eine Mischung aus exponentiellen Zerfalls-Feuchtigkeits-Sinus-Ausdrücken Bei der Modellidentifikation verwenden Sie beide Proben-ACF-Probe PACF PACF möglicherweise niemals abschneiden.53 53 gemischt Autoregressive Moving Average ARMA Prozess ARMA p, q Modell Passen Sie das exponentielle Abklingmuster an, indem Sie einige Begriffe hinzufügen.54 54 Stationarität von ARMA p, q Prozess Im Zusammenhang mit der AR Komponente ARMA p, q stationär, wenn die Wurzeln des Polynoms weniger als eins in Absolutwert ARMA p, q hat eine unendliche MA-Darstellung.55 55 Invertierbarkeit von ARMA p, q Prozess Invertierbarkeit des ARMA-Prozesses bezogen auf die MA-Komponente Überprüfen Sie die Wurzeln des Polynoms Wenn die Wurzeln kleiner als 1 im absoluten Wert sind, dann ist ARMA p, Q ist invertierbar hat eine unendliche Darstellung Koeffizienten.56 56 ARMA 1,1 Probe ACF PACF exponentielles Zerfallsverhalten.60 60 Nicht stationärer Prozess Nicht konstanter Wert, homogenes Verhalten im Laufe der Zeit zeigen, ist homogen, nicht stationär, wenn es nicht stationär ist Der erste Unterschied, wtst-t-1 1-B yt oder höhere Ordnung Unterschiede wt 1-B dyt produzieren eine stationäre Zeitreihe Y t autoregressive intergrated gleitenden Durchschnitt der Ordnung p, d, q ARIMA p, d, q Wenn die d-Differenz , Wt 1-B dyt produziert eine stationäre ARMA p, q Prozess ARIMA p, d, q.61 61 Der zufällige Spaziergang ARIMA 0,1,0 Einfachste nichtstationäre Modell Erste Differenzierung eliminiert serielle Abhängigkeit ergibt einen weißen Rauschprozess.62 62 yt 20 y t-1 et Nachweis des nicht-stationären Prozesses - Beispiel ACF stirbt langsam aus - Beispiel PACF signifikant bei der ersten Verzögerung - Beispiel PACF-Wert bei Verzögerung 1 nahe bei 1 erster Unterschied - Time-Serie von wt stationär-Beispiel ACF PACF zeigt keinen signifikanten Wert - Use ARIMA 0,1,0,63 63 Der zufällige Spaziergang ARIMA 0,1,1 Unendliche AR-Darstellung, abgeleitet aus ARIMA 0,1,1 IMA 1,1 ausgedrückt als exponentiell gewichteter gleitender Durchschnitt EWMA Von allen vergangenen Werten.64 64 ARIMA 0,1,1 - Der Mittelwert des Prozesses bewegt sich zeitlich nach oben - Beispiel ACF stirbt relativ langsam - Beispiel PACF 2 signifikante Werte bei Verzögerungen 1 2 - erster Unterschied sieht stationär aus - Beispiel ACF PACF an MA 1 Modell wäre für den ersten Unterschied geeignet, sein ACF schneidet nach dem ersten Verzögerungs-PACF-Abklingmuster ab Mögliche Modell AR 2 Überprüfen Sie die Wurzeln. Einleitung zu ARIMA Nichtseasonal models. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie , Die allgemeinste Klasse von Modellen für die Prognose einer Zeitreihe, die gemacht werden kann, um stationär zu sein, indem sie gegebenenfalls differenziert werden, vielleicht in Verbindung mit nichtlinearen Transformationen wie Protokollierung oder Ablassen, wenn nötig Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistische Die Eigenschaften sind im Laufe der Zeit konstant. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine konstante Amplitude, und sie wackelt in einer konsistenten Weise, dh ihre kurzfristigen zufälligen Zeitmuster sehen immer gleich in einem statistischen Sinne aus Daß seine Autokorrelationskorrelationen mit ihren eigenen vorherigen Abweichungen vom Mittelwert über die Zeit konstant bleiben oder äquivalent, daß sein Leistungsspektrum über die Zeit konstant bleibt. Eine zufällige Variable dieser Form kann wie üblich als eine Kombination aus Signal und Rauschen und dem Signal betrachtet werden Wenn man offensichtlich ist, könnte ein Muster von schneller oder langsamer mittlerer Reversion oder sinusförmiger Oszillation oder schnellem Wechsel im Zeichen sein, und es könnte auch eine saisonale Komponente haben. Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal von dem zu trennen Rauschen und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für eine stationäre Zeitreihe ist eine lineare, dh regressionsgleiche Gleichung, bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen Das ist. Der voreingestellte Wert von Y ist eine Konstante und / oder eine gewichtete Summe aus einem oder mehreren neueren Werten von Y und einer gewichteten Summe von einem oder mehreren neueren Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es a Reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und mit Standardregressionssoftware ausgestattet werden kann. Zum Beispiel ist ein autoregressives AR 1-Modell erster Ordnung für Y ein einfaches Regressionsmodell, in dem die unabhängige Variable steht Nur Y lag um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt Wenn einige der Prädiktoren Verzögerungen der Fehler sind, ist ein ARIMA-Modell nicht ein lineares Regressionsmodell, da es keine Möglichkeit gibt, den letzten Periodenfehler als zu spezifizieren Eine unabhängige Variable müssen die Fehler auf einer Perioden-Periode-Basis berechnet werden, wenn das Modell an die Daten angepasst wird. Aus technischer Sicht ist das Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind Obwohl sie lineare Funktionen der vergangenen Daten sind. Also, Koeffizienten in ARIMA-Modellen, die verzögerte Fehler beinhalten, müssen durch nichtlineare Optimierungsmethoden abgesenkt werden, anstatt nur ein System von Gleichungen zu lösen. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Durchschnittliche Verzögerungen der stationärisierten Serien in der Prognosegleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler werden als gleitende Durchschnittsterme bezeichnet, und eine Zeitreihe, die differenziert werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modellen. Ein nicht seasonales ARIMA-Modell wird als ARIMA p, d, q-Modell klassifiziert, wobei p die Anzahl autoregressiver Begriffe ist. D ist die Anzahl der für die Stationarität benötigten Nichtseasonaldifferenzen und ist die Anzahl der verzögerten Prognosefehler in der Vorhersagegleichung. Die Prognosegleichung wird wie folgt aufgebaut. Zuerst bezeichnen wir die d-te Differenz von Y, die bedeutet Zweiter Unterschied von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden Vielmehr ist es die erste Differenz der ersten Differenz, die das diskrete Analog einer zweiten Ableitung ist, dh die lokale Beschleunigung der Reihe anstatt Seine lokale Tendenz. In Bezug auf y die allgemeine Prognose Gleichung ist. Hier die gleitenden durchschnittlichen Parameter s sind so definiert, dass ihre Zeichen sind negativ in der Gleichung, nach der Konvention von Box und Jenkins eingeführt Einige Autoren und Software einschließlich der R-Programmiersprache definieren So dass sie Pluszeichen haben, wenn die tatsächlichen Zahlen in die Gleichung gesteckt sind, gibt es keine Zweideutigkeit, aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort von AR 1, AR bezeichnet 2, und MA 1, MA 2 usw. Um das passende ARIMA-Modell für Y zu identifizieren, beginnen Sie mit der Bestimmung der Reihenfolge der Differenzierung d, um die Serie zu stationieren und die Brutto-Features der Saisonalität zu entfernen, vielleicht in Verbindung mit einer Varianz-Stabilisierung Transformation wie Logging oder Deflating Wenn Sie an dieser Stelle stoppen und voraussagen, dass die differenzierte Serie konstant ist, haben Sie nur einen zufälligen Spaziergang oder ein zufälliges Trendmodell gepasst. Allerdings können die stationärisierten Serien noch autokorrelierte Fehler haben, was darauf hindeutet, dass einige AR-Begriffe P & sub1; und eine Anzahl von MA-Terme q & sub1; sind ebenfalls in der Prognosegleichung erforderlich. Der Prozeß der Bestimmung der Werte von p, d und q, die für eine gegebene Zeitreihe am besten sind, wird in späteren Abschnitten der Noten, deren Verbindungen, diskutiert werden Sind an der Spitze dieser Seite, aber eine Vorschau auf einige der Arten von Nicht-Seasonal ARIMA-Modelle, die häufig angetroffen werden, ist unten gegeben. ARIMA 1,0,0 Autoregressives Modell erster Ordnung, wenn die Serie stationär und autokorreliert ist, vielleicht kann es Als ein Vielfaches seines eigenen vorherigen Wertes vorausgesagt werden, plus eine Konstante Die Prognose Gleichung in diesem Fall ist. which ist Y regressed auf sich selbst verzögert um eine Periode Dies ist ein ARIMA 1,0,0 konstante Modell Wenn der Mittelwert von Y ist Null , Dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 in der Größenordnung ist, muss er kleiner als 1 in der Größe sein, wenn Y stationär ist, beschreibt das Modell das Mittelrückkehrverhalten, in dem der nächste Periodenwert liegt Prognostiziert werden, um 1 mal so weit weg von dem Mittel zu sein, da dieser Periodenwert Wenn 1 negativ ist, prognostiziert er das Mittelrückkehrverhalten mit dem Wechsel der Zeichen, dh es sagt auch voraus, dass Y unterhalb der mittleren nächsten Periode liegen wird, wenn es oben ist Die mittlere diese Periode. In einem autoregressiven Modell der zweiten Ordnung ARIMA 2,0,0 gibt es auch einen Y-t-2-Term auf der rechten Seite und so weiter. Je nach den Zeichen und Größen der Koeffizienten ist ein ARIMA 2 , 0,0-Modell könnte ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet, wie die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist. WELLE 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht ist Stationär ist das einfachste Modell für sie ein zufälliges Spaziergangmodell, das als Begrenzungsfall eines AR 1 - Modells betrachtet werden kann, bei dem der autoregressive Koeffizient gleich 1 ist, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell Kann geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die Langzeitdrift in Y Dieses Modell könnte als ein Nicht-Intercept-Regressionsmodell eingebaut werden, bei dem die erste Differenz von Y die abhängige Variable ist Es enthält nur einen nicht-seasonalen Unterschied und einen konstanten Begriff, wird es als ARIMA 0,1,0 Modell mit konstant eingestuft Das random-walk-ohne - Drift-Modell wäre ein ARIMA 0,1,0 Modell ohne constant. ARIMA 1, 1,0 differenziertes Autoregressivmodell erster Ordnung Wenn die Fehler eines zufälligen Spaziergangsmodells autokorreliert werden, kann das Problem eventuell durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung behoben werden - dh durch Rücksetzen der ersten Differenz von Y auf sich selbst Verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein autoregressives Modell erster Ordnung mit einer Ordnung von Nichtseason-Differenzen und einem konstanten Term - dh einem ARIMA 1,1,0 Modell. ARIMA 0 , 1,1 ohne konstante, einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell wird durch das einfache exponentielle Glättungsmodell vorgeschlagen. Erinnern Sie sich, dass für einige nichtstationäre Zeitreihen, zB solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, die zufällige Walk-Modell funktioniert nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte Mit anderen Worten, anstatt die jüngste Beobachtung als die Prognose der nächsten Beobachtung zu nehmen, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um herauszufiltern Das Rauschen und die genaue Schätzung des lokalen Mittels Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt der vergangenen Werte, um diesen Effekt zu erzielen. Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen einer ist Die sogenannte Fehlerkorrekturform, bei der die vorherige Prognose in Richtung des von ihr vorgenommenen Fehlers eingestellt wird. Weil e t-1 Y t-1 - t-1 definitionsgemäß umgeschrieben werden kann, wie es sich um eine ARIMA handelt 0,1,1 - without-constant Prognose Gleichung mit 1 1 - Dies bedeutet, dass Sie eine einfache exponentielle Glättung passen können, indem Sie es als ARIMA 0,1,1 Modell ohne Konstante angeben und der geschätzte MA 1 Koeffizient entspricht 1- Minus-alpha in der SES-Formel Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in den 1-Perioden-Prognosen 1 bedeutet, dass sie dazu neigen, hinter Trends oder Wendepunkten um etwa 1 Perioden zurückzukehren Durchschnittliches Alter der Daten in den 1-Perioden-Prognosen eines ARIMA 0,1,1 - without-Konstante-Modells ist 1 1 - 1 Also, wenn 1 0 8, ist das Durchschnittsalter 5 As 1 nähert sich 1 , Wird das ARIMA 0,1,1 - without-konstantes Modell zu einem sehr langfristigen gleitenden Durchschnitt, und als 1 nähert sich 0 wird es ein zufälliges-walk-ohne-Drift-Modell. Was ist der beste Weg, um Autokorrelation hinzufügen zu korrigieren AR-Terme oder Hinzufügen von MA-Terme In den vorangegangenen zwei Modellen, die oben diskutiert wurden, wurde das Problem der autokorrelierten Fehler in einem zufälligen Walk-Modell auf zwei verschiedene Arten festgelegt, indem ein verzögerter Wert der differenzierten Reihe der Gleichung hinzugefügt wurde oder ein verzögerter Wert der Prognose hinzugefügt wurde Fehler Welcher Ansatz ist am besten Eine Faustregel für diese Situation, die später noch ausführlicher erörtert wird, ist, dass eine positive Autokorrelation in der Regel am besten durch Hinzufügen eines AR-Termes zum Modell behandelt wird und eine negative Autokorrelation in der Regel am besten durch Hinzufügen behandelt wird Ein MA-Term In geschäftlichen und ökonomischen Zeitreihen entsteht eine negative Autokorrelation oft als Artefakt der Differenzierung. Im Allgemeinen reduziert das Differenzieren eine positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation verursachen. Also das ARIMA 0,1,1 Modell, in dem Differenziert wird von einem MA-Term begleitet wird, wird häufiger als ein ARIMA 1,1,0 Modell verwendet. ARIMA 0,1,1 mit konstanter einfacher exponentieller Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich etwas Flexibilität Zuerst darf der geschätzte MA 1 - Koeffizient negativ sein, dies entspricht einem Glättungsfaktor größer als 1 in einem SES-Modell, was in der Regel nicht durch das SES-Modell-Anpassungsverfahren erlaubt ist. Zweitens haben Sie die Möglichkeit, eine Konstante einzuschließen Im ARIMA-Modell, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend abzuschätzen. Das ARIMA-0,1,1-Modell mit Konstante hat die Vorhersagegleichung. Die Prognosen für ein Periodenabschätzung von diesem Modell sind qualitativ ähnlich wie bei Das SES-Modell, mit der Ausnahme, dass die Trajektorie der Langzeitprognosen typischerweise eine abfallende Linie ist, deren Steigung gleich mu ist, anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseasonalunterschiede in Verbindung mit MA-Terme verwenden. Der zweite Unterschied einer Serie Y ist nicht einfach der Unterschied zwischen Y und selbst, der von zwei Perioden verzögert ist, sondern vielmehr der erste Unterschied der ersten Differenz Die Änderung der Änderung von Y in der Periode t Somit ist die zweite Differenz von Y in der Periode t gleich Yt - Yt - 1 - Yt - 1 - Yt - 2Yt - 2Y t - 1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion, die die Beschleunigung oder Krümmung in der Funktion zu einem gegebenen Zeitpunkt misst. ARIMA 0,2,2 Modell ohne Konstante prognostiziert, dass die Der zweite Unterschied der Baureihe entspricht einer linearen Funktion der letzten beiden Prognosefehler. Wenn man sich umstellen kann, wo 1 und 2 die MA 1 - und MA 2 - Koeffizienten sind, handelt es sich um ein allgemeines lineares exponentielles Glättungsmodell im wesentlichen das gleiche wie das Holt-Modell, Und Browns Modell ist ein Sonderfall Es nutzt exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch einen lokalen Trend in der Serie abzuschätzen. Die langfristigen Prognosen dieses Modells konvergieren zu einer geraden Linie, deren Neigung von der durchschnittlichen Tendenz abhängt Ende der Serie. ARIMA 1,1,2 ohne konstant gedämpfte Trend lineare exponentielle Glättung. Dieses Modell ist in den begleitenden Folien auf ARIMA-Modelle illustriert Es extrapoliert den lokalen Trend am Ende der Serie, sondern flacht es bei längeren Prognose-Horizonte Um eine Notiz des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat Siehe den Artikel über Warum der gedämpfte Trend von Gardner und McKenzie und dem Goldenen Regelartikel von Armstrong et al für Details. Es ist allgemein ratsam, an Modellen zu bleiben, in denen zumindest Einer von p und q ist nicht größer als 1, dh versuchen Sie nicht, ein Modell wie ARIMA 2,1,2 zu passen, da dies wahrscheinlich zu Überfüllung und gemeinsamen Faktor-Problemen führen wird, die in den Notizen ausführlicher erörtert werden Auf die mathematische Struktur von ARIMA-Modellen. Spreadsheet-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach zu implementieren auf einer Tabellenkalkulation Die Vorhersage Gleichung ist einfach eine lineare Gleichung, die auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht So, Sie Kann eine ARIMA-Prognosekalkulationstabelle einrichten, indem sie die Daten in Spalte A, die Prognoseformel in Spalte B und die Fehlerdaten abzüglich Prognosen in Spalte C speichert. Die Prognosemethode in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte bezieht In vorangehenden Zeilen der Spalten A und C, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen auf der Kalkulationstabelle gespeichert sind. RIMA steht für Autoregressive Integrated Moving Average Modelle Univariate Single-Vektor ARIMA ist eine Prognose-Technik, die die zukünftigen Werte einer Serie projiziert Basiert ganz auf seine eigene Trägheit Seine Hauptanwendung ist im Bereich der kurzfristigen Prognose, die mindestens 40 historische Datenpunkte erfordert Es funktioniert am besten, wenn Ihre Daten ein stabiles oder konsistentes Muster im Laufe der Zeit mit einem Minimum an Ausreißern zeigen Manchmal genannt Box-Jenkins nach Die ursprünglichen Autoren, ARIMA ist in der Regel überlegen, exponentielle Glättung Techniken, wenn die Daten ist recht lange und die Korrelation zwischen vergangenen Beobachtungen ist stabil Wenn die Daten kurz oder stark flüchtig sind, dann kann eine Glättung Methode besser ausführen Wenn Sie nicht mindestens 38 haben Datenpunkte, sollten Sie eine andere Methode als ARIMA betrachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist, auf Stationarität zu überprüfen Stationarity impliziert, dass die Serie auf einem ziemlich konstanten Niveau über die Zeit bleibt Wenn ein Trend existiert, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, Dann sind Ihre Daten nicht stationär Die Daten sollten auch eine konstante Varianz in ihren Schwankungen im Laufe der Zeit zeigen Dies ist leicht zu sehen, mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate In einem solchen Fall werden die Höhen und Tiefen in der Saisonalität werden Mehr dramatisch im Laufe der Zeit Ohne diese stationären Bedingungen erfüllt werden, können viele der Berechnungen mit dem Prozess verbunden werden nicht berechnet werden. Wenn eine grafische Darstellung der Daten bedeutet nonstationarity, dann sollten Sie unterscheiden sich die Serie Differencing ist eine hervorragende Möglichkeit der Umwandlung einer nichtstationären Serie zu Ein stationäres Dies geschieht durch Subtraktion der Beobachtung in der aktuellen Periode von der vorherigen Wenn diese Transformation nur einmal in einer Serie erfolgt ist, sagst du, dass die Daten zuerst differenziert wurden. Dieser Prozess eliminiert im Wesentlichen den Trend, wenn deine Serie wächst Eine ziemlich konstante Rate Wenn es mit zunehmender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten wieder unterscheiden. Ihre Daten würden dann zweitrangig sein. Autokorrelationen sind numerische Werte, die angeben, wie sich eine Datenreihe im Laufe der Zeit mit sich selbst verknüpft. Genauer gesagt, es misst, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden voneinander getrennt sind. Die Anzahl der Perioden, die auseinander liegen, wird üblicherweise als Verzögerung bezeichnet Beispielsweise korrigiert eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode voneinander in der ganzen Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten zwei Perioden voneinander getrennt sind. Die Autokorrelationen können von 1 bis -1 liegen. Ein Wert nahe bei 1 zeigt eine hohe positive Korrelation an, während ein Wert nahe bei -1 eine hohe negative Korrelation impliziert. Diese Maßnahmen werden am häufigsten durch grafische Plots ausgewertet, die Korrelagramme genannt werden. Ein Korrektogramm zeichnet die Autokorrelationswerte für eine gegebene Reihe bei verschiedenen Verzögerungen auf Autokorrelationsfunktion und ist bei der ARIMA-Methode sehr wichtig. ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion von sogenannten autoregressiven und gleitenden Durchschnittsparametern zu beschreiben. Diese werden als AR-Parameter autoregessive und MA-Parameter bezeichnet, die die Mittelwerte erzeugen Modell mit nur 1 Parameter kann geschrieben werden, wie X. Zeitreihe unter Untersuchung. 1 der autoregressive Parameter der Ordnung 1.X t-1 die Zeitreihe verzögerte 1 Periode. E t der Fehlerterm des Modells. Dies bedeutet einfach Dass jeder gegebene Wert X t durch eine Funktion seines vorherigen Wertes, X t-1, plus einige unerklärliche zufällige Fehler erklärt werden kann. E t Wenn der Schätzwert von A 1 30 war, wäre der aktuelle Wert der Reihe verwandt Zu 30 von seinem Wert 1 Zeitraum Natürlich könnte die Serie mit mehr als nur einem vergangenen Wert verknüpft werden. Zum Beispiel. X t A 1 X t-1 A 2 X t-2 E t. This zeigt an, dass der aktuelle Wert von Die Reihe ist eine Kombination der beiden unmittelbar vorhergehenden Werte, X t-1 und X t-2, plus einige zufällige Fehler E t Unser Modell ist jetzt ein autoregressives Modell der Ordnung 2.Moving Average Models. A zweite Art von Box-Jenkins Modell wird als gleitendes Durchschnittsmodell bezeichnet Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept hinter ihnen ganz anders. Die sich bewegenden Durchschnittsparameter beziehen sich auf das, was in der Periode t nur zu den zufälligen Fehlern geschieht, die in vergangenen Zeitperioden aufgetreten sind, dh E t - 1, E t-2, usw. anstelle von X t-1, X t-2, Xt-3 wie in den autoregressiven Ansätzen Ein gleitendes Durchschnittsmodell mit einem MA-Term kann wie folgt geschrieben werden: Der Begriff B 1 heißt a MA des Auftrags 1 Das negative Vorzeichen vor dem Parameter wird nur für Konventionen verwendet und wird in der Regel automatisch von den meisten Computerprogrammen ausgedruckt. Das obige Modell sagt einfach, dass jeder gegebene Wert von X t direkt nur mit dem zufälligen Fehler in verbunden ist Die vorherige Periode, E t-1 und den aktuellen Fehlerterm, E t Wie bei autoregressiven Modellen können die gleitenden Mittelmodelle auf Strukturen höherer Ordnung ausgedehnt werden, die unterschiedliche Kombinationen abdecken und die durchschnittliche Länge verlaufen Zu bauen, die sowohl autoregressive als auch gleitende Mittelparameter zusammenfassen. Diese Modelle werden oft als Mischmodelle bezeichnet. Dies macht zwar ein komplizierteres Vorhersageinstrument aus, doch kann die Struktur tatsächlich die Serie besser simulieren und eine genauere Prognose erzeugen. Pure Modelle bedeuten, dass die Struktur besteht nur aus AR - oder MA-Parametern - nicht beides. Die von diesem Ansatz entwickelten Modelle werden in der Regel als ARIMA-Modelle bezeichnet, weil sie eine Kombination aus autoregressivem AR, Integration I - in Bezug auf den umgekehrten Prozess der Differenzierung zur Prognose und gleitenden Durchschnitt verwenden MA-Operationen Ein ARIMA-Modell wird üblicherweise als ARIMA p, d, q angegeben. Dies entspricht der Reihenfolge der autoregressiven Komponenten p, der Anzahl der differenzierenden Operatoren d und der höchsten Ordnung des gleitenden Durchschnittsterms. Zum Beispiel ARIMA 2,1,1 Bedeutet, dass du ein autoregressives Modell zweiter Ordnung hast, mit einer ersten gleitenden durchschnittlichen Komponente, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Die richtige Spezifikation. Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation zu verwenden ist Wie viele AR - und MA-Parameter zu berücksichtigen Dies ist, was viel von Box-Jenkings 1976 dem Identifizierungsprozess gewidmet wurde. Es hing von der grafischen und numerischen Auswertung der Probe Autokorrelation und partiellen Autokorrelationsfunktionen ab. Nun, für Ihre Grundmodelle die Aufgabe Ist nicht zu schwierig Jeder hat Autokorrelationsfunktionen, die einen bestimmten Weg aussehen. Wenn man aber in der Komplexität aufsteigt, sind die Muster nicht so leicht zu erkennen. Um die Sache schwieriger zu machen, repräsentiert Ihre Daten nur eine Stichprobe des zugrunde liegenden Prozesses Ausreißer, Messfehler, etc. können den theoretischen Identifikationsvorgang verzerren. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft.
No comments:
Post a Comment