Bayesiansk analys av dynamiska faktormodeller
Vid prognostisering av makroekonomiska storheter, som t.ex. BNP-tillväxt och inflation, finns ofta ett mycket stort antal potentiellt informativa tidsserier av varierande kvalitet att tillgå. Om delar av denna information ignoreras, riskeras sämre och felaktiga prognoser. å andra sidan är det mycket svårt, både från en statistisk och beräkningsteknisk synvinkel, att på ett effektivt sätt utnyttja och sammanfatta alla tidsserierna.
I projektet studeras så kallade dynamiska faktormodeller, en typ av modeller som på senare tid sett allt mer användning inom tillämpad nationalekonomisk forskning. Dynamiska faktormodeller kännetecknas av att de sammanfattar informationen i en stor mängd variabler i ett fåtal faktorer och att de, till skillnad från traditionell faktoranalys, tar hänsyn till beroendet mellan observationerna i tidsseriedata.
Mer specifikt studeras effektiva prognosmetoder, där effektivitet avser både statistisk och beräkningsmässig effektivitet, samt metoder som kan ge vägledning vid specificeringen av modellen med fokus på hur många faktorer som ska användas och hur tidsberoendet, dynamiken, ska modelleras
Sune Karlsson, Handelshögskolan, Örebro universitet
2009-2015
Projektet tar sin utgångspunkt i den allt rikare tillgången på data och de möjligheter och utmaningar de större datamängderna ger upphov till. Samtidigt som det ger nya möjligheter till modellering av ekonomiska samband och förbättrade prognoser är det en utmaning att på effektivt sätt sammanfatta och inkorporera informationen från en stor mängd variabler i en statistisk modell.
Mer specifikt syftar projektet till att utveckla dynamiska modeller och metoder för prognostisering av makroekonomiska storheter som fullt ut drar nytta av de stora datamängder som finns tillgängliga idag. I projektet används två ansatser för detta, dels så kallade dynamiska faktormodeller där en stor mängd variabler kan inkluderas direkt i modellen och den gemensamma dynamiken modelleras. Dels en ansats baserad på många mindre modeller baserade på olika informationsmängder och "modell averaging", det vill säga att prognoserna från de olika modellerna viktas ihop utifrån olika kriterier.
Genomgående används en Bayesiansk ansats i projektet.
Projektets tre viktigaste resultat
Ett grundläggande problem när det gäller modellval och modell averaging i multivariate modeller av olika dimension är att traditionella likelihoodbaserade mått på anpassning som den marginella likelihooden inte är tillämpbara. Detta därför att de avser olika uppsättningar av variabler. Ding och Karlsson (2014a) föreslår den marginaliserade marginella likelihooden (MML) som en lösning på problemet i situationer när ett fåtal variabler är av intresse, exempelvis när syftet är att prognostisera ett mindre antal variabler. Genom att marginalisera ut övriga variabler i modellen erhålls ett mått som är jämförbart mellan modeller och fokuserat på den väsentliga delen av modellerna. Med vektorautoregressiva (VAR) modeller som exempel härleds analytiska uttryck för MML med konjugata priorfördelningar. För situationer där analytiska uttryck för MML inte kan erhållas visas hur simuleringsmetoder (MCMC) kan användas för att skatta MML och olika metoder för att skatta MML utvärderas. En simuleringsstudie demonstrerar att MML fungerar väl som modellvalskriterium och i tillämpning till prognostisering av BNP tillväxt och inflation för USA är kombinationsprognoser baserade på MML konkurrenskraftiga.
Ding och Karlsson (2014c) bygger vidare på Ding och Karlsson (2014a) och visar hur MML-baserat modellval och prognoskombination kan skalas upp till situationer med över 100 variabler och ett närmast astronomiskt antal potentiella modeller. För att kunna hantera en stor mängd modeller i en Bayesiansk ansats behöver specifikation av a priori-fördelningen för varje enskild modell vara i det närmaste automatisk. En ny metod för automatisk kalibrering av priorfördelningen för de olika modellerna baserad på modellens frihetsgrader föreslås. Metoden är snabbare än existerande metoder och ger minst lika bra resultat. Då det i praktiken är omöjligt att utvärdera alla potentiella modeller krävs dessutom effektiva metoder för att snabbt identifiera delmängden av väl fungerande modeller, det vill säga de modeller som är av intresse vid modellval eller som skulle ingå med en vikt skild från noll i en prognoskombination där alla modeller utvärderats. För detta föreslås en enkel och effektiv algoritm baserad på Reversible Jump Markov Chain Monte Carlo. Metoderna prövas på ett dataset med 135 variabler som beskriver USAs ekonomi där BNP-tillväxt, inflation och räntan prognostiseras. Både prognoskombination och modellval baserat på MML fungerar väl i jämförelse med andra prognosmetoder för rika datamängder.
De två tidigare studierna bygger på ansatsen att kombinera ett flertal mindre modeller som tillsammans införlivar informationen i en stor mängd variabler. Ding och Karlsson (2014b) visar hur man alternativt i en VAR modell med reducerad rang struktur direkt kan inkludera variablerna i en enda modell. I den parameterisering av den reducerade rank strukturen som föreslås kan modellen också tolkas som en dynamisk faktormodell. Parametrarna i en modell med reducerad rang är i grunden oidentifierade och ytterligare restriktioner behöver införas för att identifiera parametrarna. Två olika identifieringsstrategier - en "traditionell" linjär normalisering och en semi-ortogonal normalisering - med tillhörande a priori fördelningar och simuleringsalgoritmer föreslås och utvärderas. En viktig modellvalsfråga är valet av dimension (rang) för den reducerade rang strukturen. Olika kriterier för valet av rang föreslås och utvärderas. Metoderna utvärderas också empiriskt i en tillämpning där globala aktiemarknader prognostiseras. Sammantaget visar resultaten att en reducerad rang struktur kan leda till bättre resultat och den semi-ortogonala normaliseringen av modellen ger goda resultat även om den beräkningsmässigt är mer krävande än den linjära normaliseringen.
Nya forskningsfrågor
Projektet har visat på två framkomliga vägar för utnyttja den information som finns i dagens rika data mängder bestående av ett stort antal variabler för att modellera och prognostisera ekonomiska samband. Genomgående har vi i projektet antagit att data är normalfördelat, ett antagande som kan ifrågasättas - särskilt när det gäller finansiella data. Det finns därmed ett behov att generalisera ansatsen till andra fördelningar för data som kan vara skeva eller med tjockare svansar än normalfördelningen. Ytterligare forskning krävs också för att få mer insikt i vilka modellformuleringar som fungerar väl i olika situationer.
Projektets internationella förankring
Resultat från projektet har presenterats vid ett antal internationella workshops och konferenser och några är redan citerade i den internationella forskningslitteraturen. Citeringar enligt Google Scholar (utan självciteringar).
Karlsson (2013): 20
Ding och Karlsson (2014a): 3
Forskningsinformativa insatser
Då projektet syftar till metodutveckling är målgruppen för forskningen till stora delar inomvetenskaplig eller tillämpare som ägnar sig modellering eller prognostisering av ekonomiska samband. Dessa målgrupper nås snabbast genom presentationer på internationella konferenser och workshops, till exempel den workshop om short term forecasting som arrangerades av Polens centralbank. Publicering i internationella tidskrifter är också en viktig kanal för att sprida forskningsresultaten.
Projektets två viktigaste publikationer
Då projektet blivit fördröjt och i huvudsak genomförts under de två senaste åren har endast forskningsöversikten Karlsson (2013)och Andersson et al. (2015) hunnit publiceras. De två viktigaste skrifterna som projektet resulterat i är Ding och Karlsson (2014b) och Ding och Karlsson (2014c).
Projektets publiceringsstrategi
För de resultat som i dagsläget föreligger i manuskriptform eftersträvas publicering i välrenommerade internationella peer-review tidskrifter. I görligaste mån kommer open access tidskrifter att väljas.
Publikationer
Editerade volymer
Karlsson, Sune, (2013), ‘Forecasting with Bayesian Vector Autoregression’, ch. 15, p 791-897 in Elliot, G. and Timmermann, A., eds, Handbook of Economic Forecasting, vol 2B, Elsevier.
Artiklar i refereebedömda tidskrifter
Andersson, August, Junjun Deng, Ke Du, Mei Zheng, Caiqing Yan, Martin Sköld, och Örjan Gustafsson, (2015), ’ Regionally-Varying Combustion Sources of the January 2013 Severe Haze Events over Eastern China’, Environmental Science and Technology, 49, 2038-43.
Manuskript
Ding, Shutong, Bayesian VAR models with asymmetric lags, Mimeo, Handelshögskolan vid Örebro universitet.
Ding, Shutong, och Sune Karlsson (2013), Model Selection in Dynamic Factor Models, Mimeo, Handelshögskolan vid Örebro universitet.
Ding, Shutong och Sune Karlsson (2014a), Model averaging and variable selection in VAR-models, Mimeo, Handelshögskolan vid Örebro universitet.
Ding, Shutong och Sune Karlsson (2014b), Bayesian forecasting using reduced rank VARs, Mimeo, Handelshögskolan vid Örebro universitet.
Ding, Shutong och Sune Karlsson (2014c), Bayesian forecast combination in VAR models with many predictors, Mimeo, Handelshögskolan vid Örebro universitet.
Karlsson, Sune, (2012), ‘Conditional posteriors for the reduced rank regression model’, Working Paper 2012:11, Örebro University Business School.
Avhandlingar
Shutong Ding, (2014), “Model Choice in Bayesian VAR Models”, Doktorsavhandling, Örebro universitet.
Konferenspresentationer
Workshop on Model Uncertainty, University of Warwick, 30/5-1/6 2010: Model Selection in Dynamic Factor Models (Shutong Ding och Sune Karlsson)
Computational and Financial Econometrics (CFE ’11), London, 17-19/12, 2011: Model averaging and variable selection in VAR-models (Shutong Ding och Sune Karlsson)
Rimini Conferences in Economics & Finance, Toronto, 16-18/8 2012: Model averaging and variable selection in VAR-models (Shutong Ding och Sune Karlsson)
7th Rimini Bayesian Econometrics Workshop, Rimini, 25-26/6, 2013: Bayesian forecast combination in VAR models with many predictors (Shutong Ding och Sune Karlsson)
Rimini Conferences in Economics & Finance, Rimini, 9-10/6, 2014: Bayesian forecasting with reduced rank VARs (Shutong Ding och Sune Karlsson)
Short term forecasting workshop, Warszawa, 13-14/11, 2014: Bayesian forecasting with reduced rank VARs (Shutong Ding och Sune Karlsson)