文献悦读 | 经济话语中的词汇联系及其对宏观经济预测的影响
商务英语研究院
读完需要
3分钟速读仅需 1 分钟
Linking words in economic discourse: Implications for macroeconomic forecasts
文献来源:
International Journal of Forecasting,
Volume 36, Issue 4,
2020,
Pages 1517-1530,
ISSN 0169-2070,
https://doi.org/10.1016/j.ijforecast.2019.12.001.
(https://www.sciencedirect.com/science/article/pii/S0169207019302511)
作者信息:
J. Daniel Aromi
IIEP-Baires UBA-Conicet FCE, Universidad Catolica Argentina
1
荐刊提要
本研究通过词向量表示法开发了一套衡量非结构化新闻信息的指标,并以《华尔街日报》近九十年的内容为语料库,建立并训练了模型。通过商业周期预测的实践,验证了这些指标所包含的信息量。词向量的表示可以揭示有意义的词汇关系,进而用于构建关于不确定性的指标。无论是样本内还是样本外的预测实践,都证明了这些指标对于预测未来经济活动具有重要价值。将不同主观状态(如不确定性、恐惧、悲观等)相关的指数组合起来,能够进一步提高信息的含金量。这一成果在信息内容上超越了文献中现有的基于字典计数方法的技术。
2
成果掠影
2.1
训练词向量的初步分析
在开展预测分析前,先对词向量捕捉的信息进行初评。通过选定的词向量关联示例,验证了训练向量在经济语境下学习词义的能力。同时,评估了一个旨在揭示“不确定性”现象的指标,考察其与重要宏观经济事件的同期相关性。
2.2
宏观经济预测
通过商业周期预测任务,评价不确定性指标的信息含量。这些分析不仅具有其本身价值,还能广泛衡量这些指标在宏观经济分析中的相关性。成果意味着,学术界和政策制定者通过应用自然语言处理技术于大规模非结构化数据,能够获得显著益处。
2.3
与替代方法的比较
本研究集中于自然语言处理工具的应用,这些工具能在经济语境中自动学习含义,并从非结构化数据中高效提取信息。尽管如此,基于少量关键词或预定义字典的指标包含丰富信息。这些传统方法基于专家对分类或关键词的便捷判断。这些替代策略的相对效能尚待明确。
3
总结展望
基于自然语言处理领域发展出的词向量表示(WVR)技术,本项研究提出了一种定量化非结构化新闻信息的新方法。研究表明,这种方法能够在经济领域内学习到词语间的有意义联系,并利用这些联系来构建反映不确定性及新闻内容中其它主观状态的指数。
借助实时经济活动数据,这些指数成功捕获了重要信息。通过样本内外的预测实验,研究发现不确定性指数能有效预测商业周期的变动。同时,贝叶斯模型平均(BMA)方法的应用证明了综合不同主观状态下指数信息的优势,这些信息的价值明显优于文献中提出的基于词典计数的传统方法。如此,先进的机器学习工具便能够创造出既易于解释又富含信息的宏观经济分析指标。
对于本研究的未来发展方向,可考虑基于更广泛的训练和测试文本集来实施,以提高指标的精确度。虽然增加的文本量不一定直接提升信息量,但精心挑选的文本能够提供更准确的指标。此外,可探索自动化选择非结构化数据中关键主观特征的方法。最后,尽管使用词向量表示作为神经网络输入可能会失去一些直观解释性,但研究非线性预测模型的性能仍是一个值得探索的方向。
点击下方蓝字 获取原文PDF
相关阅读
Thanks for being with us.
❖ 欢 迎 分 享 到 朋 友 圈 哦 ❖