Sunday, October 9, 2016

Difference Between Moving Average And Autoregressive Model

'N Rima staan ​​vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan ​​bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan ​​slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science. There is 'n aantal benaderings tot modellering tydreekse. Ons skets 'n paar van die mees algemene benaderings hieronder. Tendens, Seisoene, Residuele ontbindings Een benadering is om die tydreeks ontbind in 'n tendens, seisoenale en residuele komponent. Drie eksponensiële gladstryking is 'n voorbeeld van hierdie benadering. Nog 'n voorbeeld, die sogenaamde seisoenale loess, is gebaseer op plaaslik geweegde kleinste kwadrate en bespreek deur Cleveland (1993). Ons het nie seisoenale loess bespreek in hierdie handboek. Frekwensie-gebaseerde metodes Ander benadering, wat algemeen gebruik word in wetenskaplike en ingenieurstoepassings, is om die reeks in die frekwensiedomein te ontleed. 'N Voorbeeld van hierdie benadering in die modellering van 'n sinusvormige tipe datastel word in die bundel defleksie gevallestudie. Die spektrale plot is die primêre instrument vir die frekwensie tydreeksanalise. Outoregressiewe (AR) Models 'n gemeenskaplike benadering vir die modellering van eenveranderlike tydreekse is die outoregressiewe (AR) model: Xt delta phi1 X phi2 X cdots phip X By, waar (Xt) is die tydreeks, (at) is wit geraas, en delta verlaat (1 - som p phii regs) mu. met (mu) wat na die proses beteken. 'N outoregressiewe model is bloot 'n lineêre regressie van die huidige waarde van die reeks teen een of meer vorige waardes van die reeks. Die waarde van (p) is aan die orde van die AR model genoem. AR modelle ontleed kan word met een van verskeie metodes, insluitend standaard lineêre kleinste kwadrate tegnieke. Hulle het ook 'n eenvoudige interpretasie. Bewegende gemiddelde (MA) Models Nog 'n algemene benadering vir die modellering van eenveranderlike tydreekse modelle is die bewegende gemiddelde (MA) model: Xt mu Op - theta1 A - theta2 A - cdots - thetaq A, waar (Xt) is die tydreeks, (mu ) is die gemiddelde van die reeks, (a) wit geraas terme, en (theta1,, ldots,, thetaq) is die parameters van die model. Die waarde van (Q) is aan die orde van die MA-model genoem. Dit wil sê, 'n bewegende gemiddelde model is konseptueel 'n lineêre regressie van die huidige waarde van die reeks teen die wit geraas of ewekansige skokke van een of meer vorige waardes van die reeks. Die ewekansige skokke by elke punt word aanvaar dat die kom van dieselfde verspreiding, tipies 'n normaalverspreiding, met plek op nul en konstant skaal. Die onderskeid in hierdie model is dat hierdie ewekansige skokke is propogated om toekomstige waardes van die tyd reeks. Pas die MA skattings is meer ingewikkeld as met AR modelle omdat die fout terme is nie waarneembaar. Dit beteken dat iteratiewe nie-lineêre passing prosedures moet gebruik word in die plek van lineêre kleinste kwadrate. MA modelle het ook 'n minder voor die hand liggend interpretasie as AR modelle. Soms is die ACF en PACF sal stel voor dat 'n MA-model 'n beter model keuse en soms albei AR sou wees en MA terme gebruik moet word in dieselfde model (sien Afdeling 6.4.4.5). Let egter daarop dat die fout terme na die model is geskik moet onafhanklik wees en volg die standaard aannames vir 'n eenveranderlike proses. Box en Jenkins gewild 'n benadering wat die bewegende gemiddelde en die outoregressiewe benaderings in die boek Tydreeksanalise kombineer: Vooruitskatting en beheer (Box, Jenkins, en Reinsel, 1994). Alhoewel beide outoregressiewe en bewegende gemiddelde benaderings reeds bekend (en is oorspronklik ondersoek deur Yule), die bydrae van Box en Jenkins was in die ontwikkeling van 'n sistematiese metode vir die identifisering en die skatte van modelle wat beide benaderings kan inkorporeer. Dit maak Box-Jenkins modelle 'n kragtige klas modelle. Die volgende paar afdelings sal hierdie modelle bespreek in detail. Before 1970 ekonometrici en tydreeks ontleders gebruik aansienlik verskillende metodes om 'n tydreeksmodel. Ekonometrici geskoei tydreeks is 'n standaard lineêre regressie met verklarende veranderlikes deur ekonomiese teorie / intuïsie voorgestel om die bewegings in tydreeksdata te verduidelik. Hulle aanvaar dat die tyd reeks wat stationaire (groeiende oortyd) geen effek op hul empiriese ontleding het. Tydreeks ontleders aan die ander kant geïgnoreer hierdie tradisionele ekonometriese analise. Hulle geskoei 'n tydreeks as 'n funksie van sy verlede waardes. Hulle het rondom die probleem van nie-stationariteit deur breukmetodes die data om dit stilstaande maak. Dan, Clive Granger en Paul Newbold gebeur 1. Ekonometrici is gedwing om aandag te skenk aan die metodes van tydreekse ontleders, die mees bekende van wat was die BoxJenkins benader ontwikkel deur George P Box en Gwilym Jenkins en gepubliseer in hul legendariese monografie Tydreeksanalise : Vooruitskatting en beheer 2. Box en Jenkins beweer (suksesvol) wat nie-stationaire data stilstaande deur breukmetodes die reeks gemaak kan word. Hierdie reeks, Mathy / wiskunde is die insette in Box-Jenkins ontleding. Die algemene model vir Mathy / wiskunde word geskryf as, mathYphi1Y phi2Y. phipY epsilonttheta1epsilon theta2epsilon. thetaqepsilon / wiskunde waar mathphi / wiskunde en maththeta / wiskunde is onbekend parameters en mathepsilon / wiskunde is onafhanklike identies verdeelde fout terme met 'n nul gemiddelde. Hier is Mathy / wiskunde net uitgedruk in terme van sy verlede waardes en die huidige en vorige waardes van die dwaling terme. Hierdie model staan ​​bekend as outoregressiewe geïntegreerde bewegende gemiddelde of mathARIMA (p, d, q) / wiskunde model van mathY. p / wiskunde is die aantal uitgestel waardes van Mathy / wiskunde wat die outoregressiewe (AR) aard van model, mathq / wiskunde verteenwoordig is die aantal uitgestel waardes van die foutterm wat die bewegende gemiddelde (MA) aard van model en mathd verteenwoordig / wiskunde is die aantal kere wat Mathy / wiskunde moet verskille aan die stilstaande Mathy / wiskunde te produseer. Die term geïntegreerde impliseer dat ten einde 'n voorspelling van Mathy / wiskunde behaal. ons het om op te som (of integreer oor) die waardes van Mathy / wiskunde omdat Mathy / wiskunde is die differenced waardes van die oorspronklike reeks Mathy. / Wiskunde Indien geen breukmetodes betrokke is, is hierdie model 'n outoregressiewe genoem bewegende gemiddelde mathARMA (p, q) / wiskunde met mathp / wiskunde en mathq / wiskunde behoud van hul oorspronklike betekenis en geen mathd. / Wiskunde Die term mathARIMA / wiskunde of mathARMA / wiskunde is baie verwarrend omdat beide, die mathAR / wiskunde en mathMA / wiskunde komponente dieselfde wiskundige vorm. Hulle is albei lineêre kombinasies van hede en verlede waardes van ewekansige veranderlikes. Die mathAR / wiskunde-komponent is die lineêre kombinasie van waarneembare waardes van Mathy / wiskunde, terwyl die mathMA / wiskunde-komponent is die lineêre kombinasie van die onwaarneembare wit geraas versteuring terme. Dit is net een van daardie onbenullighede wat jy gebruik het sou kry om met verloop van tyd. Ekonometrici geïgnoreer the Box-Jenkins benadering op die eerste, maar is gedwing om aandag te skenk aan hulle wanneer dit mathARIMA / wiskunde voorspellings begin konsekwent beter as voorspellings gebaseer op standaard ekonometriese modellering. Die gebrek aan gesonde ekonomiese teorie agter die mathARIMA / wiskunde was iewers vir ekonometrici te aanvaar. Hulle het gereageer deur die ontwikkeling van 'n ander klas van modelle wat auroregressive en bewegende gemiddelde komponente van Box-Jenkins benadering met die verklarende veranderlikes benadering van standaard ekonometrie opgeneem. Die eenvoudigste van sulke modelle is die mathARIMAX / wiskunde wat net 'n mathARIMA / wiskunde met bykomende verklarende veranderlikes wat deur ekonomiese teorie. 'N Standaard mathARIMAX / wiskunde sou geskryf word as, mathYbeta. X phi1Y phi2Y. phipY epsilonttheta1epsilon theta2epsilon. thetaqepsilon / wiskunde waar mathX / wiskunde enige ekonomiese veranderlike kan wees. 3k Views middot View upvotes middot Nie vir Reproduksie Het jy 'n blik op hierdie skakel: 8 ARIMA modelle OTexts Dit is die hoofstuk gewy aan ARIMA modelle van 'n fantastiese gratis aanlyn handboek oor tydreeks vooruitskatting van Rob J Hyndman P einde van die outoregressiewe deel . Dit is die aantal onbekende terme wat jou sein vermenigvuldig op verlede keer (soveel verlede keer as jou waarde p) D mate van eerste breukmetodes betrokke. Aantal kere wat jy hoef te verskil jou tyd-reeks 'n stilstaande een Q einde van die bewegende gemiddelde deel te hê. Dit is die aantal onbekende terme wat jou voorspelling foute vermeerder op die verlede (soveel verlede keer as jou waarde q) Daar is 'n goeie tegnieke om al hierdie parameters te beraam (gebaseer op die outokorrelasie - ACF - en gedeeltelike outokorrelasiefunksies - PACF): people. duke. edu/ en die proses kan komplekse en tydrowend wees, selfs meer as jy het baie tyd reeks te hanteer met. In R is daar 'n funksie genoem auto. arima in die vooruitsig pakket wat al hierdie parameters outomaties te evalueer, selfs die seisoen deel (bykomende waardes te bereken in die geval is daar is seisoenaliteit in jou tydreekse). 1.8k Views middot View upvotes middot Nie vir ReproductionARMA en ARIMA (Box-Jenkins) modelle ARMA en ARIMA (Box-Jenkins) modelle in die voorafgaande gedeeltes het ons gesien hoe die waarde van 'n eenveranderlike tydreekse op tydstip t. x t. gemodelleer kan word met behulp van 'n verskeidenheid van bewegende gemiddelde uitdrukkings. Ons het ook getoon dat komponente soos tendense en periodisiteit in die tydreeks uitdruklik gemodelleer kan word en / of geskei het, met die data wat ontbind word in tendens, seisoenale en oorblywende komponente. Ons het ook gewys, in die vorige besprekings oor outokorrelasie. dat die volle en gedeeltelike outokorrelasie koëffisiënte is baie nuttig in die identifisering en modellering patrone in tydreekse. Hierdie twee aspekte van tydreeksanalise en modellering kan gekombineer word in 'n meer algemene en dikwels baie effektief, algehele modellering raamwerk. In sy basiese vorm hierdie benadering staan ​​bekend as ARMA modellering (outoregressiewe bewegende gemiddelde), of wanneer breukmetodes is ingesluit in die proses, ARIMA of Posbus-Jenkins modellering, nadat die twee skrywers wat sentraal tot die ontwikkeling daarvan was (sien kassie amp Jenkins, 1968 BOX1, en Box, Jenkins amp Reinsel, 1994 BOX2). Daar is geen vaste reël met betrekking tot die aantal tydperke wat nodig is vir 'n suksesvolle model oefening, maar vir meer komplekse modelle, en vir 'n groter vertroue in prosedures fiks en validering, reeks met 50 keer stappe word dikwels aanbeveel. ARMA modelle kombineer outokorrelasie metodes (AR) en bewegende gemiddeldes (MA) in 'n saamgestelde model van die tydreeks. Voor oorweging van hoe hierdie modelle kan gekombineer word, ons kyk na elkeen afsonderlik. Ons het reeds gesien dat bewegende gemiddelde (MA) modelle kan gebruik word om 'n goeie passing te gee aan 'n paar datastelle en variasies op hierdie modelle wat dubbel of trippel eksponensiële gladstryking kan hanteer tendens en periodieke komponente in die data behels. Verder kan sulke modelle word gebruik om voorspellings dat die gedrag van die vorige tydperke naboots skep. 'N eenvoudige vorm van sulke modelle, gebaseer op vorige data, kan geskryf word as: Waar die beta Ek terme is die toepassing op voor waardes in die tyd reeks gewigte, en dit is gewoonlik om beta i 1 definieer, sonder verlies van algemeenheid. So vir 'n eerste orde proses, q 1 en het ons die model: dit wil sê die bewegende gemiddelde waarde word geskat as 'n geweegde gemiddelde van die huidige en onmiddellike verlede waardes. Dit gemiddelde proses is, in 'n sekere sin, 'n pragmatiese uitstrykingsmeganisme sonder 'n direkte skakel na 'n statistiese model. Ons kan egter 'n statistiese (of stogastiese) model wat die prosedures van bewegende gemiddeldes in samewerking met 'n arbitrêre prosesse behels spesifiseer. Dit is duidelik dat die verwagte waarde van xt onder: As ons toelaat dat 'n stel van 'n onafhanklike en identies verdeelde variate ( 'n ewekansige proses) met 'n nul gemiddelde en bekende vaste afwyking, dan kan ons die proses as 'n bewegende gemiddelde van orde q in terme van skryf hierdie model is 0, sodat die model is slegs geldig indien die xt is reeds aangepas om 'n nul beteken nie of as 'n vaste konstante (die gemiddelde van die XT) is bygevoeg om die opsomming. Dit is ook duidelik dat die variansie van xt is eenvoudig: Bogenoemde analise kan uitgebrei word om die kovariansie, cov (x t xtk.), Wat ons vind opbrengste te evalueer: Let daarop dat nie die gemiddelde waarde, of die kovariansie (of outokovariansiefunksie) by lag k is 'n funksie van die tyd, t. sodat die proses is tweede orde stilstaande. Die bogenoemde uitdrukking stel ons in staat om 'n uitdrukking te kry vir die outokorrelasie funksie (ACF): As k 0 rho k 1 en vir k GT Q rho k 0. Verder is die ACF is simmetriese en rho k rho-k. Die ACF kan bereken word vir 'n eerste orde MA proses: Die outoregressiewe of AR komponent van 'n ARMA model geskryf kan word in die vorm: waar die terme in is outokorrelasie koëffisiënte op lags 1,2. p en Z t is 'n residuele foutterm. Let daarop dat hierdie foutterm spesifiek betrekking het op die huidige tydperk, t. So vir 'n eerste orde proses, p 1 en ons het die model: Hierdie uitdrukkings meld dat die beraamde waarde van x op tydstip t word bepaal deur die onmiddellik voorafgaande waarde van x (dws op tydstip t -1) vermenigvuldig met 'n maat, Alpha . van die mate waarin die waardes vir alle pare waardes by tydperke lag 1 uitmekaar gekorreleer (dit wil sê hulle outokorrelasie), plus 'n residuele foutterm, z. op tyd t. Maar dit is juis die definisie van 'n Markov-proses. so 'n Markov-proses is 'n eerste orde outoregressiewe proses. As alfa 1 die model bepaal dat die volgende waarde van x is eenvoudig die vorige waarde plus 'n ewekansige foutterm, en dus is 'n eenvoudige 1D ewekansige loop. Indien meer terme ingesluit die model skat die waarde van x op tydstip t deur 'n geweegde som van hierdie terme plus 'n ewekansige fout komponent. As ons hierbo vervang die tweede uitdrukking in die eerste, ons het: en herhaal toediening van hierdie vervanging opbrengste: Nou as alfa LT1 en k is groot, kan hierdie uitdrukking word geskryf in die omgekeerde volgorde, met dalende terme en met bydrae van die term in x op die regterkant van die uitdrukking besig vanishingly klein, so ons het: Omdat die regterkant van hierdie uitdrukking modelle xt as die som van 'n geweegde stel voor waardes, in hierdie geval ewekansige fout terme, is dit duidelik dat hierdie AR model is, in werklikheid, 'n vorm van MA model. En as ons aanneem dat die fout terme nul gemiddelde en konstante stryd, dan soos in die MA-model wat ons het die verwagte waarde van die model as ook 0, die aanvaarding van die xt is aangepas om 'n nul gemiddelde verskaf, met variansie: Nou as solank Alpha LT1 hierdie opsomming is beperk en is eenvoudig 1 / (1- alfa), so ons het: (. x t x tk) soos met die MA-model hierbo, kan hierdie analise word uitgebrei na die kovariansie, cov evalueer van 'n eerste orde AR proses, wat ons vind opbrengste: vir Alpha LT1 hierdie opsomming is beperk en is eenvoudig Alpha k / (1- alfa 2), so ons het: dit blyk dat vir 'n eerste orde outoregressiewe model die outokorrelasie funksie (ACF) is eenvoudig gedefinieer deur opeenvolgende magte van die eerste orde outokorrelasie, met die voorwaarde Alpha LT1. Vir Alpha gt0 is dit net 'n vinnig dalende krag of eksponensiële kurwe, neig na nul, of vir lt0 dit is 'n dempende ossillasie kurwe, weer neig na nul. As 'n aanname gemaak word dat die tydreeks stilstaan ​​bogenoemde ontleding kan uitgebrei word om die tweede en hoër orde outokorrelasies. Ten einde 'n AR model geskik is om 'n waargenome dataset, poog ons om die som van 'n vierkant foute (a kleinste kwadrate pas) met behulp van die kleinste aantal terme wat 'n bevredigende passing om die data te verskaf verminder. Modelle van hierdie tipe word beskryf as outoregressiewe. en toegepas kan word om beide tydreekse en ruimtelike datastelle (sien verder, ruimtelike Outoregressiemodelle). Hoewel dit in teorie 'n outoregressiewe model kan 'n goeie passing vir 'n waargeneem dataset verskaf, sou dit oor die algemeen vereis voor verwydering van en tendens en periodieke komponente, en selfs dan kan 'n groot aantal terme nodig het om 'n goeie passing te gee aan die data. Maar deur die kombinasie van die AR modelle met MA modelle, ons kan 'n gesin van gemengde modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word te produseer. Hierdie modelle is bekend as ARMA en ARIMA modelle, en word beskryf in die volgende onderafdelings. In die vorige twee onderafdelings het ons die MA modus van orde Q: en die AR model van orde p: Ons kan hierdie twee modelle kombineer deur hulle eenvoudig bymekaar te tel as 'n model van orde (P Q.), Waar ons p AR terme en q MA terme: In die algemeen, hierdie vorm van gesamentlike ARMA model gebruik kan word om 'n tydreeks met minder terme algehele as óf 'n MA of 'n AR model deur hulself te modelleer. Dit gee uitdrukking aan die geskatte waarde op tydstip t as die som van Q terme wat die gemiddelde variasie van ewekansige variasie oor Q vorige tydperke (die MA komponent) verteenwoordig, plus die bedrag van P AR terme wat die huidige waarde van x te bereken as die geweegde som van die p mees onlangse waardes. Maar hierdie vorm van model veronderstel dat die tydreeks stilstaan, wat selde die geval. In die praktyk, tendense en periodisiteit bestaan ​​in baie datastelle, so daar is 'n behoefte om hierdie effekte te verwyder voordat hulle aansoek doen sulke modelle. Die opheffing is tipies deur onder meer in die model 'n aanvanklike breukmetodes stadium, gewoonlik een keer, twee of drie keer gedoen, totdat die reeks is ten minste ongeveer stilstaande - uitstal nie voor die hand liggend tendense of periodiciteiten. Soos met die MA en AR prosesse, is die breukmetodes proses beskryf word deur die einde van breukmetodes, byvoorbeeld 1, 2, 3. Gesamentlik hierdie drie elemente waaruit 'n driedubbele: (.. P d Q) wat die aard van die model toegepas definieer. In hierdie vorm, is die model beskryf word as 'n ARIMA model. Die brief wat ek in ARIMA verwys na die feit dat die dataset aanvanklik was differenced (vgl differensiasie) en wanneer die modellering voltooi die resultate moet dan word opgesom of geïntegreer tot die finale skattings en voorspellings te produseer. ARIMA modellering word hieronder bespreek. Soos in die vorige subartikel, die kombinasie van breukmetodes van 'n nie-stasionêre tydreekse met die ARMA model bied 'n kragtige familie van modelle wat in 'n wye verskeidenheid situasies te kommunikeer toegepas kan word. Ontwikkeling van hierdie uitgebreide vorm van model is grootliks te danke aan G E P Box en G M Jenkins, en as gevolg daarvan ARIMA modelle is ook bekend as Box-Jenkins modelle. Die eerste stap in die Box-Jenkins prosedure is om verskil die tydreeks totdat dit stilstaan, en daardeur te verseker dat die tendens en seisoenale komponente verwyder. In baie gevalle is een of twee stadium breukmetodes voldoende. Die differenced reeks sal korter as die bron reeks deur c tyd stappe, waar c die omvang van die breukmetodes wees. 'N ARMA model word dan toegerus om die gevolglike tydreekse. Omdat ARIMA modelle het drie parameters is daar baie variasies op die moontlike modelle wat gebruik kan word toegerus. Maar die besluit oor watter hierdie parameters kan moet gelei word deur 'n aantal basiese beginsels: (i) die model moet so eenvoudig as moontlik wees, dit wil sê bevat so min terme as moontlik, wat op sy beurt beteken dat die waardes van p en q moet klein wees (ii) die pas aan historiese data moet so goed as moontlik te wees, dit wil sê die grootte van die kwadraat verskille tussen die geskatte waarde op enige vorige tydperk en die werklike waarde, moet tot die minimum beperk (kleinste kwadrate beginsel) - die residue van die gekose model kan dan ondersoek om te sien of enige oorblywende residue is aansienlik verskil van 0 (sien verder hieronder) (iii) die gemeet gedeeltelike outokorrelasie op lags 1,2,3. moet 'n aanduiding van die einde van die AR komponent verskaf, met ander woorde die wat gekies is vir Q waarde (iv) die vorm van outokorrelasie funksie (ACF) plot kan raai die tipe ARIMA model vereis - die tabel hieronder (uit die NIST) verskaf riglyne oor interpretasie van die vorm van die ACF in terme van model seleksie. ARIMA Model tipe seleksie behulp ACF vorm Reeks is nie stilstaan. Standard ARIMA modelle word dikwels beskryf deur die driedubbele: (.. P d Q) soos hierbo. Hierdie definieer die struktuur van die model in terme van die orde van AR, breukmetodes en MA modelle te gebruik. Dit is ook moontlik om soortgelyke parameters vir seisoenaliteit in die data in te sluit, hoewel sulke modelle is meer kompleks te pas en te interpreteer - die afval (P. D. Q) word algemeen gebruik om so 'n model komponente te identifiseer. In die kiekie van SPSS hieronder getoon, is die dialoog vir die hand te kies nie-seisoenale en seisoenale strukturele elemente vertoon (soortgelyke fasiliteite is beskikbaar in ander geïntegreerde pakkette, soos SAS / ETS). Soos gesien kan word, die dialoog stel ook die data te omskep (tipies om te help met variansie stabilisering) en om gebruikers in staat stel om 'n konstante in die model (die verstek) insluit. Hierdie spesifieke sagteware hulpmiddel kan uitskieters te bespeur indien nodig, volgens 'n verskeidenheid van opsporing prosedures, maar in baie gevalle sal uitskieters is ondersoek en aangepas of verwyder en vervang waardes beraam, voor enige sodanige ontleding. SPSS Tyd Reeks Modeler: ARIMA modellering, kundige modus Verskeie ARIMA modelle kan toegerus om die data, met die hand of deur middel van 'n outomatiese proses (bv 'n stapsgewyse proses), en een of meer maatreëls gebruik om te oordeel wat is die beste in terme van pas en parsimonie. Model vergelyking maak tipies gebruik van een of meer van die vroeëre beskryf in hierdie handboek inligting teoretiese maatreëls - AIC, BIC en / of MDL (die R funksie, ARIMA (), bied die AIC meet, terwyl SPSS bied 'n verskeidenheid van geskikte maatreëls, ingesluit 'n weergawe van die BIC statistiek ander instrumente wissel in die voorsien maatreëls -. Minitab wat 'n verskeidenheid van TSA metodes bied, sluit nie AIC / BIC tipe statistieke). In die praktyk 'n wye verskeidenheid van maatreëls (dws anders as / bykomend tot die kleinste kwadrate gebaseer maatreëls, kan gebruik word om die model gehalte te evalueer. Byvoorbeeld, kan die gemiddelde absolute fout en die maksimum absolute fout wees bruikbare maatreëls, aangesien selfs 'n goeie kleinste kwadrate passing kan steeds swak wees in plekke. verskeie sagteware pakkette kan ook 'n algehele maatstaf van die outokorrelasie wat in die residue na pas die model kan bly. 'n statistiek dikwels toegepas is te danke aan Ljung en Box (1978 LJU1) en is van die vorm: waar n die aantal monsters (datawaardes), ri is die monster outokorrelasie op lag ek en k is die totale aantal lags waaroor die berekening uitgevoer word Q k is ongeveer versprei as.. 'n chi-kwadraat verspreiding met k -. m grade van vryheid, waar m die aantal parameters wat gebruik word in pas die model, met uitsluiting van enige konstante term of voorspeller veranderlikes (dit wil sê net insluitende die PD Q drietalle) As die maatstaf is statisties beduidend dit dui daarop dat die residue beduidende outokorrelasie bevat steeds na die model is toegerus, wat daarop dui dat 'n verbeterde model gesoek moet word. Voorbeeld: Modellering die groei van die lugredery passasiersgetalle Die volgende is 'n voorbeeld van outomatiese toebehore, met behulp van SPSS te the Box-Jenkins-Reinsel toetsdata van die lugredery passasiersgetalle REI1 vroeër in hierdie handboek. Aanvanklik geen spesifikasie van die datums wat maande binne jaar is vermeld. Die wat deur die outomatiese proses model was 'n ARIMA model (0,1,12), dit wil sê die proses korrek geïdentifiseer dat die reeks vereis een vlak van breukmetodes en toegepas n bewegende gemiddelde model met 'n periodisiteit van 12 en geen outokorrelasie komponent om die pas data. Die model pas geproduseer n R 2 waarde van 0,966, wat baie hoog is, en 'n maksimum absolute fout (MAE) van 75. Die visuele passing van die model om die data lyk uitstekend, maar die plot van die oorblywende outokorrelasie ná pas en Ljung - kader toets toon dat beduidende outokorrelasie bly, wat daarop dui dat 'n verbeterde model is moontlik. Outomatiese ARIMA geskik is om Internasionale Airline Passasiers: Maandeliks totale, 1949-1960 Om te ondersoek dit verder 'n hersiene model is toegerus, gebaseer op die bespreking van hierdie datastel deur Box en Jenkins (1968) en die opgedateerde uitgawe van Chatfields (1975 CHA1) boek in wat hy gebruik Minitab sy ontleding (6de uitgawe, 2003) illustreer. Die tydreekse is gedefinieer as 'n periodisiteit van 12 maande en 'n ARIMA model met komponente (0,1,1), (0,1,1). Grafies die resultate lyk baie soortgelyk aan die grafiek hierbo, maar met hierdie model die R-kwadraat is 0,991, die MAE41 en die Ljung-Box statistiek is nie meer beduidende (12.6, met 16 grade van vryheid). Die model is dus 'n verbetering op die oorspronklike (outomaties gegenereer) weergawe, wat bestaan ​​uit 'n nie-seisoenale MA en 'n seisoenale MA komponent, geen outoregressiewe komponent, en een vlak van breukmetodes vir die seisoenale en nie-seisoenale strukture. Of pas is handleiding of outomatiese, kan 'n ARIMA model 'n goeie raamwerk vir die modellering van 'n tydreeks, of dit kan wees dat alternatiewe modelle of benaderings 'n meer bevredigende resultaat. Dikwels is dit moeilik om vooraf te weet hoe goed 'n gegewe voorspelling model is geneig om te wees, want dit is net in die lig van sy vermoë om toekomstige waardes van die data-reeks wat dit werklik kan geoordeel word voorspel. Dikwels word hierdie proses benader word deur die pas van die model om die verlede data uitgesluit onlangse tydperke (ook bekend as die hande-out monsters), en dan met behulp van die model om hierdie bekende toekomstige gebeure te voorspel, maar selfs hierdie bied slegs 'n beperkte vertroue in die toekoms geldigheid. Langer termyn vooruitskatting kan uiters onbetroubaar wees gebruik van sulke metodes. Dit is duidelik dat die internasionale lugverkeer statistieke model hierbo beskryf is nie in staat om korrek te voorspel passasiers getalle deur in die 1990's en daarna, of die 5-jaar daling in Amerikaanse internasionale lugredery passasiersgetalle post 2001/09/11. Net so kan 'n ARIMA model toegerus om historiese waardes van aandelebeurs pryse of indekswaardes (bv die NYSE of FTSE indekse) en sal tipies bied 'n uitstekende geskik is om die data (opbrengs 'n R-kwadraat-waarde van beter as 0.99), maar is dikwels van weinig nut vir die voorspelling van toekomstige waardes van hierdie pryse of indekse. Tipies ARIMA modelle word gebruik vir vooruitskatting, veral op die gebied van makro - en mikro-ekonomiese modelle. Hulle kan egter toegepas word in 'n wye verskeidenheid van dissiplines, hetsy in die vorm wat hier beskryf word, of aangevul met bykomende voorspeller veranderlikes wat geglo om die betroubaarheid van die voorspellings gemaak verbeter. Laasgenoemde is belangrik, want die hele struktuur van die ARMA modelle wat hierbo bespreek is, hang af van voor waardes en onafhanklike ewekansige gebeure met verloop van tyd, nie op enige verduidelikende of veroorsakende faktore. Vandaar ARIMA modelle sal slegs weerspieël en uit te brei afgelope patrone, wat nodig mag in voorspellings te verander deur faktore soos die makro-ekonomiese omgewing, tegnologie skofte, of langer termyn hulpbron en / of omgewingsveranderinge. BOX1 Box G E P, Jenkins G M (1968). Sommige onlangse vooruitgang in vooruitskatting en beheer. Toegepaste Statistiek, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Tydreeksanalise, voorspelling en beheer. 3rd ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen (sien ook, 6 ed. 2003) LJU1 Ljung G M, Posbus G E P (1978) Op 'n mate van 'n gebrek aan Fit in Tydreeksmodelle. Biometrika, 65, 297303 NIST / SEMATECH e-handboek statistiese metodes, www. itl. nist. gov/div898/handbook/ Afdeling 6.4: Inleiding tot tyd reeks. 2010 SPSS / PASW 17 (2008) AnalyzeForecasting (Tydreeksmodelle) REI1 Reinsel GC Datastelle vir Box-Jenkins modelle: www. stat. wisc. edu/Moving~~V gemiddelde en eksponensiële gladstryking modelle As 'n eerste stap in die beweging van buite gemiddelde modelle, ewekansige loop modelle, en lineêre tendens modelle, nonseasonal patrone en tendense kan geëkstrapoleer deur 'n bewegende-gemiddelde of glad model. Die basiese aanname agter gemiddelde en glad modelle is dat die tyd reeks is plaaslik stilstaande met 'n stadig wisselende gemiddelde. Vandaar, neem ons 'n bewegende (plaaslike) gemiddelde om die huidige waarde van die gemiddelde skat en dan gebruik dit as die voorspelling vir die nabye toekoms. Dit kan beskou word as 'n kompromie tussen die gemiddelde model en die ewekansige-stap-sonder-drif-model. Dieselfde strategie gebruik kan word om te skat en ekstrapoleer 'n plaaslike tendens. 'N bewegende gemiddelde is dikwels 'n quotsmoothedquot weergawe van die oorspronklike reeks, want kort termyn gemiddelde het die effek van gladstryking uit die knoppe in die oorspronklike reeks. Deur die aanpassing van die mate van gladstryking (die breedte van die bewegende gemiddelde), kan ons hoop om 'n soort van 'n optimale balans tussen die prestasie van die gemiddelde en die stogastiese wandeling modelle slaan. Die eenvoudigste soort gemiddelde model is die. Eenvoudige (ewe-geweeg) Moving Average: Die voorspelling vir die waarde van Y op tyd T1 wat gemaak word op tydstip t is gelyk aan die eenvoudige gemiddelde van die mees onlangse m waarnemings: (hier en elders sal ek die simbool 8220Y-hat8221 gebruik om op te staan vir 'n voorspelling van die tyd reeks Y gemaak op die vroegste moontlike voor datum deur 'n gegewe model.) Hierdie gemiddelde is gesentreer op tydperk t (M1) / 2, wat impliseer dat die skatting van die plaaslike gemiddelde sal neig om agter die werklike waarde van die plaaslike gemiddelde met sowat (M1) / 2 periodes. So, sê ons die gemiddelde ouderdom van die data in die eenvoudige bewegende gemiddelde is (M1) / 2 met betrekking tot die tydperk waarvoor die voorspelling is bereken: dit is die hoeveelheid tyd waarop voorspellings sal neig om agter draaipunte in die data. Byvoorbeeld, as jy gemiddeld die afgelope 5 waardes, sal die voorspellings wees oor 3 periodes laat in reaksie op draaipunte. Let daarop dat indien M1, die eenvoudige bewegende gemiddelde (SMA) model is soortgelyk aan die ewekansige loop model (sonder groei). As m is baie groot (vergelykbaar met die lengte van die skatting tydperk), die SMA model is gelykstaande aan die gemiddelde model. Soos met enige parameter van 'n voorspelling model, is dit gebruiklik om die waarde van k te pas ten einde die beste quotfitquot om die data, dit wil sê die kleinste voorspelling foute gemiddeld behaal. Hier is 'n voorbeeld van 'n reeks wat blykbaar ewekansige skommelinge toon om 'n stadig-wisselende gemiddelde. In die eerste plek kan probeer om dit aan te pas met 'n ewekansige loop model, wat gelykstaande is aan 'n eenvoudige bewegende gemiddelde van 1 kwartaal: Die ewekansige loop model reageer baie vinnig om veranderinge in die reeks, maar sodoende dit tel baie van die quotnoisequot in die data (die ewekansige skommelinge) asook die quotsignalquot (die plaaslike gemiddelde). As ons eerder probeer 'n eenvoudige bewegende gemiddelde van 5 terme, kry ons 'n gladder lyk stel voorspellings: Die 5 termyn eenvoudige bewegende gemiddelde opbrengste aansienlik kleiner foute as die ewekansige loop model in hierdie geval. Die gemiddelde ouderdom van die data in hierdie voorspelling is 3 ((51) / 2), sodat dit is geneig om agter draaipunte met sowat drie periodes. (Byvoorbeeld, blyk 'n afswaai het plaasgevind by tydperk 21, maar die voorspellings nie omdraai tot verskeie tydperke later.) Let daarop dat die langtermyn-voorspellings van die SMA model is 'n horisontale reguit lyn, net soos in die ewekansige loop model. So, die SMA model veronderstel dat daar geen neiging in die data. Maar, terwyl die voorspellings van die ewekansige loop model is eenvoudig gelyk aan die laaste waargenome waarde, die voorspellings van die SMA model is gelykstaande aan 'n geweegde gemiddelde van die afgelope waardes. Die vertroue perke bereken deur Stat Graphics vir die langtermyn-voorspellings van die eenvoudige bewegende gemiddelde nie groter as die vooruitskatting horison styg kry. Dit is natuurlik nie korrek Ongelukkig is daar geen onderliggende statistiese teorie wat ons vertel hoe die vertrouensintervalle behoort te brei vir hierdie model. Dit is egter nie te moeilik om empiriese ramings van die vertroue perke vir die langer-horison voorspellings te bereken. Byvoorbeeld, kan jy die opstel van 'n sigblad waarop die SMA model sal gebruik word om 2 stappe vooruit, 3 stappe vooruit, ens binne die historiese data monster voorspel. Jy kan dan bereken die monster standaardafwykings van die foute op elke voorspelling horison, en dan bou vertrouensintervalle vir langer termyn voorspellings deur optelling en aftrekking veelvoude van die toepaslike standaard afwyking. As ons probeer om 'n 9-termyn eenvoudige bewegende gemiddelde, kry ons selfs gladder voorspellings en meer van 'n sloerende uitwerking: Die gemiddelde ouderdom is nou 5 periodes ((91) / 2). As ons 'n 19-termyn bewegende gemiddelde te neem, die gemiddelde ouderdom toeneem tot 10: Let daarop dat, inderdaad, is die voorspellings nou agter draaipunte met sowat 10 periodes. Watter bedrag van smoothing is die beste vir hierdie reeks Hier is 'n tabel wat hulle dwaling statistieke vergelyk, ook met 'n 3-gemiddelde: Model C, die 5-termyn bewegende gemiddelde, lewer die laagste waarde van RMSE deur 'n klein marge oor die 3 - term en 9 termyn gemiddeldes, en hul ander statistieke is byna identies. So, onder modelle met 'n baie soortgelyke fout statistieke, kan ons kies of ons 'n bietjie meer responsiewe ingesteldheid of 'n bietjie meer gladheid in die voorspellings sou verkies. (Terug na bo.) Browns Eenvoudige Eksponensiële Smoothing (eksponensieel geweeg bewegende gemiddelde) Die eenvoudige bewegende gemiddelde model hierbo beskryf het die ongewenste eienskap dat dit behandel die laaste k Waarnemings ewe en heeltemal ignoreer al voorafgaande waarnemings. Intuïtief, moet afgelope data verdiskonteer in 'n meer geleidelike mode - byvoorbeeld, die mees onlangse waarneming moet 'n bietjie meer gewig kry as 2 mees onlangse, en die 2de mees onlangse moet 'n bietjie meer gewig as die 3 mees onlangse kry, en so aan. Die eenvoudige eksponensiële gladstryking (SES) model accomplishes hierdie. Laat 945 dui n quotsmoothing constantquot ( 'n getal tussen 0 en 1). Een manier om die model te skryf is om 'n reeks L dat die huidige vlak (dit wil sê die plaaslike gemiddelde waarde) van die reeks verteenwoordig as geraamde van data tot op hede te definieer. Die waarde van L op tydstip t is rekursief bereken uit sy eie vorige waarde soos volg: Dus, die huidige stryk waarde is 'n interpolasie tussen die vorige stryk waarde en die huidige waarneming, waar 945 kontroles die nabyheid van die geïnterpoleerde waarde tot die mees onlangse waarneming. Die voorspelling vir die volgende tydperk is eenvoudig die huidige stryk waarde: anders gestel ons kan die volgende voorspelling direk in terme van vorige voorspellings en vorige waarnemings uit te druk, in enige van die volgende ekwivalent weergawes. In die eerste weergawe, die voorspelling is 'n interpolasie tussen vorige skatting en vorige waarneming: In die tweede weergawe, is die volgende voorspelling verkry deur die aanpassing van die vorige skatting in die rigting van die vorige fout deur 'n breukdeel bedrag 945. is die fout gemaak by tyd t. In die derde weergawe, die voorspelling is 'n eksponensieel geweeg (dit wil sê afslag) bewegende gemiddelde met afslag faktor 1- 945: Die interpolasie weergawe van die voorspelling formule is die eenvoudigste om te gebruik as jy die uitvoering van die model op 'n spreadsheet: dit pas in 'n enkele sel en bevat selverwysings verwys na die vorige skatting, die vorige waarneming, en die sel waar die waarde van 945 gestoor. Let daarop dat indien 945 1, die SES model is gelykstaande aan 'n ewekansige loop model (sonder groei). As 945 0, die SES model is gelykstaande aan die gemiddelde model, met die veronderstelling dat die eerste stryk waarde gelyk aan die gemiddelde is ingestel. (Terug na bo.) Die gemiddelde ouderdom van die data in die eenvoudige eksponensiële-glad voorspelling is 1/945 relatief tot die tydperk waarvoor die voorspelling is bereken. (Dit is nie veronderstel duidelik te wees, maar dit kan maklik aangetoon deur die evaluering van 'n oneindige reeks.) Dus, die eenvoudige bewegende gemiddelde voorspelling is geneig om agter draaipunte met sowat 1/945 periodes. Byvoorbeeld, wanneer 945 0.5 die lag is 2 periodes wanneer 945 0.2 die lag is 5 periodes wanneer 945 0.1 die lag is 10 periodes, en so aan. Vir 'n gegewe gemiddelde ouderdom (bv bedrag van lag), die eenvoudige eksponensiële gladstryking (SES) voorspelling is 'n bietjie beter as die eenvoudige bewegende gemiddelde (SMA) voorspel, want dit plaas relatief meer gewig op die mees onlangse waarneming --i. e. dit is 'n bietjie meer quotresponsivequot om veranderinge voorkom in die onlangse verlede. Byvoorbeeld, 'n SMA model met 9 terme en 'n SES model met 945 0.2 beide het 'n gemiddelde ouderdom van 5 vir die data in hul voorspellings, maar die SES model plaas meer gewig op die laaste 3 waardes as wel die SMA model en by die Terselfdertyd is dit doesn8217t heeltemal 8220forget8221 oor waardes meer as 9 tydperke oud was, soos getoon in hierdie grafiek: nog 'n belangrike voordeel van die SES model die SMA model is dat die SES model maak gebruik van 'smoothing parameter wat voortdurend veranderlike, so dit kan maklik new deur die gebruik van 'n quotsolverquot algoritme om die gemiddelde minimum te beperk kwadraat fout. Die optimale waarde van 945 in die SES model vir hierdie reeks blyk te wees 0,2961, soos hier gewys word: die gemiddelde ouderdom van die data in hierdie voorspelling is 1 / 0,2961 3.4 tydperke, wat soortgelyk is aan dié van 'n 6-termyn eenvoudige bewegende gemiddelde. Die langtermyn-voorspellings van die SES model is 'n horisontale reguit lyn. soos in die SMA model en die ewekansige loop model sonder groei. Let egter daarop dat die vertrouensintervalle bereken deur Stat Graphics nou divergeer in 'n redelike aantreklike mode, en dat hulle aansienlik nouer as die vertrouensintervalle vir die ewekansige loop model. Die SES model veronderstel dat die reeks is 'n bietjie quotmore predictablequot as wel die ewekansige loop model. 'N SES model is eintlik 'n spesiale geval van 'n ARIMA model. sodat die statistiese teorie van ARIMA modelle bied 'n goeie basis vir die berekening van vertrouensintervalle vir die SES model. In die besonder, 'n SES model is 'n ARIMA model met een nonseasonal verskil, 'n MA (1) termyn, en geen konstante term. andersins bekend as 'n quotARIMA (0,1,1) model sonder constantquot. Die MA (1) koëffisiënt in die ARIMA model stem ooreen met die hoeveelheid 1- 945 in die SES model. Byvoorbeeld, as jy 'n ARIMA (0,1,1) model inpas sonder konstante om die reeks te ontleed hier, die beraamde MA (1) koëffisiënt blyk te wees 0,7029, wat byna presies 'n minus 0,2961. Dit is moontlik om die aanname van 'n nie-nul konstante lineêre tendens voeg by 'n SES model. Om dit te doen, net 'n ARIMA model met een nonseasonal verskil en 'n MA (1) termyn met 'n konstante, dit wil sê 'n ARIMA (0,1,1) model met 'n konstante spesifiseer. Die langtermyn-voorspellings sal dan 'n tendens wat gelyk is aan die gemiddelde tendens waargeneem oor die hele skatting tydperk is. Jy kan dit nie doen in samewerking met seisoenale aanpassing, omdat die aanpassing opsies seisoenale is afgeskakel wanneer die model tipe is ingestel op ARIMA. Jy kan egter 'n konstante langtermyn eksponensiële tendens om 'n eenvoudige eksponensiële gladstryking model voeg (met of sonder seisoenale aanpassing) deur gebruik te maak van die opsie inflasie-aanpassing in die vooruitskatting prosedure. Die toepaslike quotinflationquot (persentasie groei) koers per periode kan geskat word as die helling koëffisiënt in 'n lineêre tendens model toegerus om die data in samewerking met 'n natuurlike logaritme transformasie, of dit kan op grond van ander, onafhanklike inligting oor die langtermyn groeivooruitsigte . (Terug na bo.) Browns Lineêre (dws dubbel) Eksponensiële glad die SMA modelle en SES modelle aanvaar dat daar geen tendens van enige aard in die data (wat gewoonlik OK of ten minste nie-te-sleg vir 1- stap-ahead voorspellings wanneer die data is relatief raserig), en hulle kan verander word om 'n konstante lineêre tendens inkorporeer soos hierbo getoon. Wat van kort termyn tendense As 'n reeks vertoon 'n wisselende koers van groei of 'n sikliese patroon wat uitstaan ​​duidelik teen die geraas, en as daar 'n behoefte aan meer as 1 tydperk wat voorlê voorspel, dan skatting van 'n plaaslike tendens kan ook wees n probleem. Die eenvoudige eksponensiële gladstryking model veralgemeen kan word na 'n lineêre eksponensiële gladstryking (LES) model wat plaaslike begrotings van beide vlak en tendens bere te kry. Die eenvoudigste-time wisselende tendens model is Browns lineêr eksponensiële gladstryking model, wat twee verskillende reëlmatige reeks wat op verskillende punte gesentreer in die tyd gebruik. Die vooruitskatting formule is gebaseer op 'n ekstrapolasie van 'n streep deur die twee sentrums. ( 'N meer gesofistikeerde weergawe van hierdie model, Holt8217s, word hieronder bespreek.) Die algebraïese vorm van Brown8217s lineêr eksponensiële gladstryking model, soos dié van die eenvoudige eksponensiële gladstryking model, uitgedruk kan word in 'n aantal verskillende maar ekwivalente vorms. Die quotstandardquot vorm van hierdie model word gewoonlik uitgedruk as volg: Laat S dui die enkel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking om reeks Y. Dit is, is die waarde van S op tydperk t gegee word deur: (Onthou dat, onder eenvoudige eksponensiële gladstryking, dit sou die voorspelling vir Y by tydperk T1 wees) Dan Squot dui die dubbel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking (met behulp van dieselfde 945) tot reeks S:. ten slotte, die voorspelling vir Y tk. vir enige kgt1, word gegee deur: Dit lewer e 1 0 (dit wil sê kul n bietjie, en laat die eerste skatting gelyk wees aan die werklike eerste waarneming), en e 2 Y 2 8211 Y 1. waarna voorspellings gegenereer met behulp van die vergelyking hierbo. Dit gee dieselfde toegerus waardes as die formule gebaseer op S en S indien laasgenoemde is begin met behulp van S 1 S 1 Y 1. Hierdie weergawe van die model gebruik word op die volgende bladsy wat 'n kombinasie van eksponensiële gladstryking met seisoenale aanpassing illustreer. Holt8217s Lineêre Eksponensiële Smoothing Brown8217s LES model bere plaaslike begrotings van vlak en tendens deur glad die onlangse data, maar die feit dat dit nie so met 'n enkele glad parameter plaas 'n beperking op die data patrone wat dit in staat is om aan te pas: die vlak en tendens word nie toegelaat om wissel op onafhanklike tariewe. Holt8217s LES model spreek hierdie kwessie deur die insluiting van twee glad konstantes, een vir die vlak en een vir die tendens. Te eniger tyd t, soos in Brown8217s model, die daar is 'n skatting L t van die plaaslike vlak en 'n skatting T t van die plaaslike tendens. Hier is hulle rekursief bereken vanaf die waarde van Y op tydstip t en die vorige raming van die vlak en tendens waargeneem deur twee vergelykings wat eksponensiële gladstryking afsonderlik van toepassing op hulle. As die geskatte vlak en tendens op tydstip t-1 is L t82091 en T t-1. onderskeidelik, dan is die voorspelling vir Y tshy wat op tydstip t-1 sal gemaak is gelyk aan L t-1 T T-1. Wanneer die werklike waarde is waargeneem, is die opgedateer skatting van die vlak rekursief bereken deur interpol tussen Y tshy en sy voorspelling, L t-1 T T-1, die gebruik van gewigte van 945 en 1- 945. Die verandering in die geskatte vlak, naamlik L t 8209 L t82091. geïnterpreteer kan word as 'n lawaaierige meting van die tendens op tydstip t. Die opgedateer skatting van die tendens is dan rekursief bereken deur interpol tussen L t 8209 L t82091 en die vorige skatting van die tendens, T t-1. die gebruik van gewigte van 946 en 1-946: Die interpretasie van die tendens-glad konstante 946 is soortgelyk aan dié van die vlak glad konstante 945. Models met klein waardes van 946 aanvaar dat die tendens verander net baie stadig met verloop van tyd, terwyl modelle met groter 946 aanvaar dat dit vinniger is om te verander. 'N Model met 'n groot 946 is van mening dat die verre toekoms is baie onseker, omdat foute in die tendens-skatting word baie belangrik wanneer voorspel meer as een tydperk wat voorlê. (Terug na bo.) Die smoothing konstantes 945 en 946 kan in die gewone manier word beraam deur die vermindering van die gemiddelde kwadraat fout van die 1-stap-ahead voorspellings. Wanneer dit in Stat Graphics gedoen, die skattings uitdraai om te wees 945 0.3048 en 946 0,008. Die baie klein waarde van 946 beteken dat die model veronderstel baie min verandering in die tendens van een tydperk na die volgende, so basies hierdie model is besig om 'n langtermyn-tendens skat. Volgens analogie met die idee van die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike vlak van die reeks, die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike tendens is eweredig aan 1/946, hoewel nie presies gelyk aan Dit. In hierdie geval is dit blyk 1 / 0,006 125. Dit isn8217t n baie presiese aantal sover die akkuraatheid van die skatting van 946 isn8217t regtig 3 desimale plekke te wees, maar dit is van dieselfde algemene orde van grootte as die steekproefgrootte van 100 , so hierdie model is gemiddeld oor 'n hele klomp van die geskiedenis in die skatte van die tendens. Die voorspelling plot hieronder toon dat die LES model skat 'n effens groter plaaslike tendens aan die einde van die reeks as die konstante tendens geskat in die SEStrend model. Ook waarvan die beraamde waarde van 945 is byna identies aan die een wat deur die pas van die SES model met of sonder tendens, so dit is amper dieselfde model. Nou, doen hierdie lyk redelike voorspellings vir 'n model wat veronderstel is om te beraming 'n plaaslike tendens As jy hierdie plot 8220eyeball8221, dit lyk asof die plaaslike tendens afwaarts gedraai aan die einde van die reeks: Wat het die parameters van hierdie model gebeur is beraam deur die vermindering van die kwadraat fout van 1-stap-ahead voorspellings, nie langer termyn voorspellings, in welke geval die tendens 'n groot verskil doesn8217t maak. As alles wat jy is op soek na is 1-stap-ahead foute, is jy nie sien die groter prentjie van tendense oor (sê) 10 of 20 periodes. Ten einde hierdie model meer in harmonie te kry met ons oogbal ekstrapolasie van die data, kan ons met die hand die tendens-glad konstante pas sodat dit 'n korter basislyn vir tendens skatting. Byvoorbeeld, as ons kies om te stel 946 0.1, dan is die gemiddelde ouderdom van die gebruik in die skatte van die plaaslike tendens data is 10 periodes, wat beteken dat ons die gemiddeld van die tendens oor daardie laaste 20 periodes of so. Here8217s wat die voorspelling plot lyk asof ons '946 0.1 terwyl 945 0.3. Dit lyk intuïtief redelike vir hierdie reeks, maar dit is waarskynlik gevaarlik om hierdie tendens te ekstrapoleer nie meer as 10 periodes in die toekoms. Wat van die fout statistieke Hier is 'n model vergelyking vir die twee modelle hierbo asook drie SES modelle getoon. Die optimale waarde van 945.Vir die SES model is ongeveer 0,3, maar soortgelyke resultate (met 'n bietjie meer of minder 'n responsiewe ingesteldheid, onderskeidelik) verkry met 0,5 en 0,2. (A) Holts lineêre exp. glad met alfa 0,3048 en beta 0,008 (B) Holts lineêre exp. glad met alfa 0,3 en beta 0,1 (C) Eenvoudige eksponensiële gladstryking met alfa 0,5 (D) Eenvoudige eksponensiële gladstryking met alfa 0,3 (E) Eenvoudige eksponensiële gladstryking met alfa 0,2 hul statistieke is byna identies, so ons can8217t regtig die keuse te maak op die basis van 1-stap-ahead voorspelling foute binne die data monster. Ons het om terug te val op ander oorwegings. As ons glo dat dit sinvol om die huidige tendens skatting van wat die afgelope 20 periodes of so gebeur baseer, kan ons 'n saak vir die LES model met 945 0.3 en 946 0.1 maak. As ons wil hê agnostikus te wees oor die vraag of daar 'n plaaslike tendens, dan een van die SES modelle makliker om te verduidelik kan wees en sou ook vir meer middel-of-the-road voorspellings vir die volgende 5 of 10 periodes. (Terug na bo.) Watter tipe tendens-ekstrapolasie die beste: horisontale of lineêre empiriese bewyse dui daarop dat, indien die data is reeds aangepas (indien nodig) vir inflasie, dan is dit dalk onverstandig om kort termyn lineêre ekstrapoleer wees tendense baie ver in die toekoms. Tendense duidelik vandag mag verslap in die toekoms as gevolg van uiteenlopende oorsake soos produk veroudering, toenemende mededinging en sikliese afswaai of opwaartse fases in 'n bedryf. Om hierdie rede, eenvoudige eksponensiële gladstryking voer dikwels beter out-of-monster as wat dit andersins word verwag, ten spyte van sy quotnaivequot horisontale tendens ekstrapolasie. Gedempte tendens veranderinge van die lineêre eksponensiële gladstryking model word ook dikwels gebruik in die praktyk om 'n aantekening van konserwatisme in te voer in die tendens projeksies. Die gedempte-tendens LES model geïmplementeer kan word as 'n spesiale geval van 'n ARIMA model, in die besonder, 'n ARIMA (1,1,2) model. Dit is moontlik om vertrouensintervalle rondom langtermyn voorspellings wat deur eksponensiële gladstryking modelle bereken deur die oorweging van hulle as spesiale gevalle van ARIMA modelle. (Pasop: nie alle sagteware bereken vertrouensintervalle vir hierdie modelle korrek.) Die breedte van die vertrouensintervalle hang af van (i) die RMS fout van die model, (ii) die tipe glad (eenvoudige of lineêr) (iii) die waarde (s) van die smoothing konstante (s) en (iv) die aantal periodes voor jy voorspel. In die algemeen, die tussenposes versprei vinniger as 945 kry groter in die SES model en hulle uitgebrei, sodat baie vinniger as lineêre, eerder as eenvoudige smoothing gebruik. Hierdie onderwerp word verder in die ARIMA modelle deel van die notas bespreek. (Terug na bo.)


No comments:

Post a Comment