查看原文
其他

前沿: 从随机方法到软计算的时间序列预测最全综述

计量经济圈 计量经济圈 2023-03-29

凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

《从随机方法到软计算的时间序列预测最全综述》

关于下方文字内容,作者:马莹,西南财经大学金融学院,通信邮箱:mochen@smail.swufe.edu.cn作者之前的文章:1.站稳2900, TOP刊推出“中国金融市场发展及现状系统回顾”万字雄文!2.我们应该在多大程度上信任交叠/渐进/多期双重差分估计?

P Hendikawati et al 2020, A survey of time series forecasting from stochastic method to soft computing, J. Phys.: Conf. Ser. 1613 012019

Forecasting is a part of statistical modelling that is widely used in various fields because of its benefits in decision-making. The purpose of forecasting is to predict the future values of certain variables that vary with time using its previous values. Forecasting is related to the formation of models and methods that can be used to produce a good forecast. This research is a survey paper research that used a systematic mapping study and systematic literature review. Generally, time series research uses linear time series models, specifically the autoregressive integrated moving average model that has long been used because it has good forecasting accuracy. The successfulness of the Box–Jenkins methodology is based on the reality that various models can imitate the behaviour of various types of series, usually without requiring many parameters to be estimated in the final choice of the model. However, the assumption of stationarity that must be met makes this method inflexible to use. With the advances in computers, forecasting methods from stochastic models to soft computing continue to develop and extend. Soft computing for forecasting can provide more accurate results than traditional methods. Moreover, soft computing has many advantages in terms of the amount of data that can be analysed and the time- and cost-effectiveness of the process.

从随机方法到软计算的时间序列预测最全综述
目录

1 Abstract

预测是统计建模的一部分,由于其在决策方面的优势而被广泛应用于各个领域。预测的目的是使用其先前的值来预测随时间变化的某些变量的未来值。预测与形成可以用于产生良好预测的模型和方法有关。本研究是一项调查论文研究,采用系统化映射研究和系统化文献综述。通常,时间序列研究使用线性时间序列模型,特别是自回归移动平均模型,由于其具有良好的预测准确性而长期以来被广泛使用。Box-Jenkins方法的成功在于实际上,各种模型都可以模拟各种类型的序列行为,通常不需要在最终选择模型时估计许多参数。然而,必须满足的平稳性假设使得该方法难以灵活使用。随着计算机的进步,从随机模型到软计算的预测方法不断发展和扩展。软计算用于预测可以提供比传统方法更准确的结果。此外,软计算在分析数据量以及时间和成本效益方面有许多优势。

2 Introduction

时间序列数据预测是统计建模的一部分,由于其在决策制定方面的好处而在各个领域广泛使用。时间序列分析有几个目标,即预测、建模和控制。预测是决策制定活动中重要的一部分,因为一个有效决策的制定取决于在制定决策时不可见的多个因素的影响。时间序列预测的目的是使用其以前的值来预测随时间变化的某些变量的未来值。预测与形成可用于产生良好预测的模型和方法有关。使用时间序列数据进行预测基于过去事件的行为。
时间序列数据中,过去事件的行为可以用于预测,因为预期未来过去事件的影响仍将发生。预测的好处可以在许多领域感受到,包括经济学、金融、市场营销和生产。通常,时间序列研究使用线性时间序列模型,特别是自回归移动平均(ARIMA)模型。该方法由Box和Jenkins首次引入,长期以来一直被使用,因为它具有良好的预测精度并不断发展。然而,必须满足平稳性假设,使得这种方法使用不够灵活。除了ARIMA模型外,从随机模型到软计算的预测方法不断发展。Box-Jenkins方法的成功基于各种模型可以模拟各种类型的序列行为的现实情况,通常在选择最终模型时不需要估计许多参数。

3 Methodology

该论文采用系统映射研究和系统文献综述方法,根据本文提出的时间序列预测主题识别和解释文献综述中的发现。研究与各个领域中时间序列预测方法的使用和发展相关的文献综述,以找到每种方法的新发展和最新进展。本文从随机方法到软计算方法,如人工神经网络、模糊逻辑等的发展,产生了各种预测方法的聚类和分类,并在各个领域和数据案例中进行了研究。基于所得到的映射结果,确定了未来时间序列预测研究的趋势。

4 Result and Discussion

4.1 Stochastic Method

19世纪,时间序列分析如ARCH、Q-GARCH、ST-GARCH、ABS-GARCH和指数加权移动平均(EWMA)广泛用于常用确定性模型描述的系列。1927年,Yull提出了随机性的想法,他认为每个时间序列都可以视为随机过程的实现[1]。当时间序列数据的行为不复杂且初始条件满足平稳性假设时,使用随机方法进行预测将提供高精度。用于预测时间序列的随机方法可以区分为线性和非线性。几种线性随机模型,例如自回归(AR)、移动平均(MA)、自回归移动平均(ARMA)、ARIMA、季节性ARIMA(SARIMA)、自回归分数积分移动平均(ARFIMA)、自回归条件异方差(ARCH)和广义ARCH(GARCH),以及GARCH-M、E-GARCH、T-GAR预测。
多年来,ARIMA方法经常被用于各种类型的单变量时间序列。ARIMA方法在许多领域被广泛应用,包括商业和工业,并受到许多统计学家的关注和良好发展。作为一种有用的预测方法,ARIMA模型比其他模型更简单,因为它只考虑过去的数据,不需要其他信息。ARIMA模型在预测方面具有较高的准确性。最新的ARIMA模型已被许多研究人员应用,其中包括[2-5]。时间序列数据通常具有一定的模式,往往会在一定周期内重复出现,称为季节性。SARIMA是一种可以用于处理包含季节性因素的数据的ARIMA模型。[6-10]进行了实证研究,确定SARIMA模型提供了易于实现、灵活的预测实现,其准确性与其他更复杂的预测方法相当。除了SARIMA外,可以用于预测长期时间序列数据的一种方法是ARFIMA方法。[11]和[12]使用ARFIMA预测和检查数据,这些数据表明具有长期记忆模式。

ARCH/GARCH通常用于通过分析数据序列中方差、误差和平方的影响来确定数据的波动性。如果选择的ARIMA模型不符合同方差假设,即模型仍然包含异方差性,则会使用ARCH/GARCH。该方法最初由Engle [13]引入,用于计量经济学数据,并侧重于金融应用。除金融数据外,还进行了许多将GARCH及其扩展方法应用于各种情境的研究。多个研究人员使用ARCH/GARCH分析具有波动性的数据,其中[14-20]发现ARCH/GARCH对于具有波动性的数据比ARIMA产生更好的结果。处理具有波动性和异方差性数据的另一种方法是由Morgan于1994年开发的EWMA方法。EWMA方法是一种估计未来波动性的步骤,通过给最新的观察数据比以前的数据更大的权重。[21]和[22]使用和分析了EWMA的表现,并获得了有前途的预测结果。表1至5提供了与从传统方法到利用计算机技术的复杂性方法的预测目的相关的已进行的研究列表。还总结了开发新的预测方法和技术的几项研究。

4.2 Nonlinear Time Series Modeling

[23]使用TAR建立了阈值模型,分别解决了购买力平价问题。另外四位研究人员[24-27]回顾了使用非线性预测方法(如TAR、STAR和SETAR)的各个领域。最新的研究由Davies [28]开发了一个安装包和程序,用于识别、估计和预测SETAR模型。多位专家进行的研究结果显示,非线性SETAR模型提供比AR模型更准确的预测,并产生比线性模型更小的误差。Hamilton的马尔科夫转换模型,也称为制度转换模型,是文献中最受欢迎的非线性时间序列模型之一。该模型涉及大量结构(方程),可以描述时间序列的特征。通过使这些结构之间的转换,该模型能够捕捉更复杂的动态模式。马尔科夫转换模型的一个新特征是切换机制由遵循一阶马尔科夫链的不可观察状态变量控制。马尔科夫性质指出状态变量的当前值取决于其直接前一个值。因此,一个结构可能适用于一个随机的时间段,并在发生变化时被另一个结构替换。在一项模拟研究中,Haas [29]提出了一种新的马尔科夫转换GARCH模型,可以应对估计不佳的问题或不太容易理解的动态特性。Dueker和Neely [30]结合技术交易规则的文献和提供比传统MA规则至少两个边际收益的马尔科夫转换模型的文献,开发出经济有利的交易规则,其中模型提供强大的投资组合回报。

4.3 Multivariate Time Series Method

单变量时间序列模型成功地用于预测,促使研究人员将模型的使用扩展到多变量情况。多种时间序列预测案例描述了两个或多个变量之间的关系。这可以通过使用涉及多个相关变量的更多信息来实现,从而提高模型预测数据的精度。几种适用于多元时间序列数据的时间序列数据预测模型包括向量自回归(VAR)、向量移动平均(VMA)和向量自回归移动平均(VARMA)。VAR用于分析模型中包含的干扰因素的动态效应。VAR分析与同时方程模型相同,因为它在一个模型中考虑了几个内生变量。但是,在VAR中,除了前一值解释的变量之外,每个变量还受到观察中其他内生变量的先前值的影响。VARMA模型是单变量ARIMA的概括,可用于预测多变量数据或具有多个变量的数据。VARMA模型的条件是数据必须是平稳的。VARMA模型是VAR和VMA模型的组合。这个模型的优点不仅在于能够预测数据,还在于能够看到数据之间的相互关系。[31-37]已开发了多个版本的多元VAR模型,实现了VAR/VARMA以预测各种经济案例。

4.4 Artificial Intelligence Method for Forecasting

平稳性是使用ARIMA模型进行时间序列分析过程的初始要求。在实际情况中,大多数时间序列数据都是非平稳的。人工神经网络(ANN)方法的发展为非平稳数据的时间序列分析提供了便利。然而,当时间序列数据分析过程中不需要平稳性假设时,会出现问题。随着科学的发展,许多新的技术和程序已经被开发出来。随着计算技术的进步,新的时间序列预测方法也已经被开发出来。人工智能是一种快速发展的预测方法。与随机方法相比,使用人工智能方法进行预测具有几个优点,包括(a)不需要形成特定的模型,(b)能够分析数据行为而不涉及数据的统计分布的某些假设,(c)能够处理复杂的模式和非线性数据,(d)提供更准确的预测结果。然而,使用人工智能方法的缺点是可能会陷入最优局部值。

利用时间序列数据估计未来价值的方法之一是人工神经网络(ANN)方法。目前,ANN(也称为神经网络)引起了相当大的关注。神经网络是一种监督式机器学习方法,能够表示数据关系,包括与时间相关的数据。神经网络能够解决各个领域的非线性问题,包括模式识别、投资组合管理、医学诊断、信用评级、定向营销、语音识别、财务预测、质量控制和智能搜索。这些问题使用经典模型很难解决。前馈神经网络(FFNN)模型,也称为反向传播,是最灵活的神经网络模型之一,可用于各种应用,包括预测。与其他算法相比,神经网络具有更好的自适应能力、训练和非平稳信号处理能力。神经网络能够解决使用经典模型很难解决的非线性问题。此外,神经网络在时间序列预测方面已经经历了相当多的模型发展。前馈神经网络、循环神经网络(RNN)、径向基函数(RBF)、自组织映射(SOM)、时间滞后神经网络(TLNN)和季节性人工神经网络(SANN)是用于时间序列预测的几种神经网络模型。
许多研究人员已经开发了基于人工智能的非线性方法。[38],[39],[40],[41]。[42],[43],[44]和[45]提出了许多经典神经网络方法的变体。进行了几个使用不同训练算法的实验模拟,以选择最适合ANN模型的训练算法。主要研究结果表明,ANN具有较高的准确性,比ARIMA更擅长选择最适合的预测模型。此外,已经开发并广泛应用了几种人工智能技术,如小波变换、遗传算法(GA)、模拟退火、遗传编程和混合方法,用于时间序列预测。小波变换在预测方面的应用已经实现了很长时间。[46],[47]提出并应用小波变换来预测,应用于现实生活中。随后,几位专家进行了进一步的发展。[48],[49],[50],[51],[52],[53]和[54]提出了一种自适应小波模型,用于预测,并应用了一种新的混合预测方法,由小波变换、神经网络和进化算法(EA)组成。
在一项模拟研究中,[55] 利用遗传编程的概念实现了一种新颖高效的方法。原始方法的多种变体被提出,例如[56],[57],[58],[59],[60],[61],这些方法将 ARIMA、NN、RBFN、GA、小波变换、PSO 和自适应神经模糊推理系统(ANFIS)等多种方法结合使用。在最新的研究中,[62] 提出了一种名为AR-ANFIS的时序预测新混合方法,该方法使用PSO进行训练,并使用模糊C-均值方法进行模糊化。他们的混合方法在提高了预测准确性的同时,展现出比传统方法更好的预测精度。

4.5 Support Vector Machines

支持向量机(SVM)是一种用于分类和回归预测的技术。SVM属于监督学习类别,与人工神经网络(ANN)在函数和可以解决的问题条件方面相同。使用支持向量机(SVM)的目的是通过选择训练数据的某些部分来做出具有良好泛化能力的决策。可以用于预测时间序列数据的SVM模型包括支持向量核、SVM回归、LS-SVM和DLS-SVM等多种方法。一些研究人员推广和发展了SVM用于预测,例如[63]、[64]、[65]、[66]、[67]、[68]和[69]。多位研究人员进行的实验研究使用SVM方法及其发展获得了令人满意的预测结果。

4.6 Fuzzy Logic for Forecasting

模糊逻辑是一种人工智能专家系统的发展,它可以通过将数据形成范围来简化计算以获得结果。模糊逻辑还具有灵活性,即能够适应问题的变化和不确定性,模拟复杂的非线性函数,并立即构建和应用专家经验,无需经过训练过程。已经用于预测的模糊逻辑时间序列预测方法包括模糊时间序列(FTS;时变和时不变)、模糊神经元(FNN)、神经模糊系统或神经模糊、模糊ARMA、模糊推理系统和ANFIS等多种方法。在日益复杂的系统中,模糊逻辑通常很难,并且需要很长时间来设置正确的规则和隶属函数。在NN中,当采用Yu和Chen模型的模糊逻辑时,组合方法必须是有方法的。多项实证研究表明,组合模型具有良好的应用效果。多位研究人员使用模糊逻辑和模糊组合与其他方法进行预测。例如,[70]、[71]和[72]提出了一种新的混合ANN与模糊的方法,可以成为提高预测精度的潜在方法,因为结合了ANN和模糊的优点以克服两种模型的局限性。计算机的发展也支持了使用模糊系统进行预测的发展。[73]提出了一种简化计算方法,可以最小化模糊关系矩阵的复杂计算,确定适当的去模糊化过程,并实现更好的预测精度。此外,[74]、[75]和[76]提出了用于预测的FTS。多位研究人员进一步发展了FTS,这是扩展模糊逻辑用于预测时间序列数据的一种方法。[77]首次展示了使用FTS的预测程序。其他使用FTS进行各种案例研究的研究人员包括[78]、[79]、[80]、[81]、[82]和[83]。此外,FTS正在不断发展,有多种新方法正在集成。[84]和[85]提出了一种新的FTS预测技术,比传统的FTS模型更准确。除此之外,[86]和[87]开发了一种基于FTS的混合模型,与其他方法结合,显示出良好的精度和性能。

4.7 Adaptive Neuro-fuzzy Inference System

许多研究在各种背景下实施了ANFIS方法。例如,[88]和[89]讨论了ANFIS在水文应用中的问题。[90]利用ANFIS进行电力负荷预测。[91]介绍了ANFIS,并展示了它在与Sugeno-Yasukawa、ANN或多元回归方法相比预测USD/JPY汇率方面的误差最小化、稳健性和灵活性的卓越表现。[92]介绍了模糊系统、集成、混合和适应性模型开发的软计算技术的新趋势。许多其他专家,如[93]、[94]、[95]、[96]、[97]、[98]、[99]、[100]、[101]、[102]和[103],也用ANFIS进行预测。他们的经验结果表明,在训练和验证阶段,ANFIS的性能比ANN和ARIMA更好,具有较高的相关系数值。

多位研究者报告了ANFIS与其他各种方法和方法结合的卓越预测性能。[104]介绍了ANFIS和粗糙集的组合,以最小化模糊规则的数量,并采用ANFIS和PSO的简单结构来确定参数。[105]进行了实验,比较了萤火虫算法和ANFIS组合与其他方法的性能。[106]提出了基于子集ARIMA模型对原始数据进行预处理的ANFIS建模过程以选择输入变量。在开发良好的模型时,需要考虑三个重要概念,即选择输入变量、指定聚类数和选择隶属函数。[107]将减法聚类过程应用于聚类数据,以帮助简化模糊规则。

[108]设计了一个模糊系统与RKLM相结合,以适应其隶属函数和参数以提高系统性能。[109]使用了具有网格划分技术的ANFIS。[110]提出了一种基于自适应种群活动PSO算法与最小二乘法相结合的混合学习方法,以优化ANFIS模型。[111]介绍了将新的混合学习规则与Levenberg–Marquardt和梯度方法相结合应用于ANFIS技术的方法,作为一种替代通用混合学习方法。[112]综述了元启发式算法,如GA、PSO、ABC、CSO及其变体,以训练ANFIS以克服计算昂贵的问题并减少ANFIS规则库中的规则数。[113]提出了使用TS–ANFIS混合方法的预测系统。所提出的ANFIS混合方法表现出更好的性能,并且比传统方法更有效。此外,实验结果表明优化速度快,预测精度高。

5 Conclusion: The Future of Forecasting Development

当谈到未来技术和用户机构的发展时,预测会发生两件事。首先,计算机技术的发展与越来越复杂的软件开发相结合,将是预测领域中强有力的组合。各种此时难以想象的复杂方法和技术将很快实现并应用于实际案例。其次,随着数据量的增加,数据的变化和难度水平也在增加。需要使用大量数据进行预测的机构数量也将增加。这两种计算机技术和大量数据的组合,涉及预测和数据挖掘,将在未来迅速增长,并成为一种常见现象。因此,利用软计算方法开发新的预测方法和技术非常重要,这些方法不仅可以提供比传统方法更准确的预测结果,而且在处理数据量和时间、成本效益方面也有许多优势。

References


关于时间序列方法,1.时间序列分析的各种程序, 38页集结整理成文档,2.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作,3.R软件中的时间序列分析程序包纵览,4.时间序列分析的各种程序, 38页集结整理成文档,5.时间序列数据分析的思维导图一览, 金融经济学者必备工具,6.送书: 应用时间序列分析(经典),7.为啥时间序列模型比较难学?时间序列的正名路,8.面板数据单位根检验软件操作和解读全在这里,9.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data),10.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,11.送书: 应用时间序列分析(经典),12.时间序列模型分解,季节调整分析基础,13.动态因子模型是什么, 又怎么去实现? 14.动态面板分位数估计怎么做?15.动态面板门槛回归程序公布, 使用方法介绍,16.把动态面板命令讲清楚了,对Stata的ado详尽解释,17.时间序列分析概览(今天的重点1),18.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!19.一文读懂“非平稳时间序列计量经济学分析”, 包括单位根检验, 结构突变检验等,20.中断时间序列分析ITSA是什么? 很流行的政策评估新范式!21.可以在面板回归分析中使用时间序列解释变量或被解释变量吗?22.ARIMA时间序列模型的步骤, 程序和各种检验, 附上代码并通过示例进行解读!23.使用Stata做时间序列分析书籍, 包括模型讲解以及Stata示例操作,24.时间序列中的协整检验和VECM,以及回归后的系列估计操作

关于VAR方法,1.R软件中的时间序列分析程序包纵览2.时间序列分析的各种程序, 38页集结整理成文档3.时间序列数据分析的思维导图一览, 金融经济学者必备工具4.送书: 应用时间序列分析(经典)5.为啥时间序列模型比较难学?时间序列的正名路6.时间序列中的协整检验和VECM,以及回归后的系列估计操作7.时间序列模型分解,季节调整分析基础8.空间和时间的计量,关注二位国人9.TVP-VAR时变参数VAR系列文献和估计程序10.向量自回归VAR模型操作指南针,为微观面板VAR铺基石11.VAR宏观计量模型演进与发展,无方向确认推断更好12.应用VAR模型时的15个注意点,总结得相当地道13.面板数据单位根检验软件操作和解读全在这里14.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data)15.面板向量自回归PVAR是什么? 数据, 程序和解读一步到位16.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作17.动态因子模型是什么, 又怎么去实现?18.SVAR模型的起源、识别、估计与应用, 系统讲述19.平滑转移自回归模型(STAR)应用与在R软件的操作20.Copula函数21.GVAR, 全局VAR模型是什么?该如何用软件实现, 有哪些研究文献和最新进展!22.前沿: BVAR, 贝叶斯VAR是什么, 为什么需要, 软件怎么做, 如何解读呢?23.结构性面板VAR是什么? 如何实现PSVAR呢?怎么解读?24.2021年AER上最新基于DSGE模型的宏观计量文章, 附上50篇时序, VAR模型文章!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

4年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存