查看原文
其他

【陋室推荐】| 2018-4-27

叉烧 CS的陋室 2022-08-08

【陋室推荐】

本栏目主要依据我近期的阅读和科研情况,每周为大家推荐1本书以及2篇论文,主要都会和数据科学、自然语言处理等有关,希望大家会喜欢,也欢迎大家给我推荐大家喜欢的材料,我会根据实际情况推荐给大家!


往期回顾:

【陋室推荐】| 2018-4-13

案例 | 鸢尾花案例之必须说在前面的话

Tensorflow入坑指南

Python入门指南

【NLP.TM】信息抽取

【NLP.TM】情感(观点)分析

统计自然语言处理

宗成庆

额,个人觉得,这本书可以看做是一本十分完善的文献综述,里面所隐含的文献非常丰富,如果你要学习什么方法或者研究什么问题,可以直接从这本书里面找你需要的文献从而查然后学就好了,内容很全,必要的方法会提一提,但是不太建议就指望这本书能把方法教会你。这本书没有代码,理论讲的也不多,更多的是给你综述一些比较常用、业界比较靠谱的方法,都会介绍,但是指望着这本书能落地,还是省省吧,自然语言处理的范围太大,而且现在的方法个人觉得还不是特别成熟,还需要进一步研究,很多东西都没有讨论出一个共识。

A novel method based on numerical fitting for oil price trend forecasting

Zhao, L. T., Wang, Y., Guo, S. Q., & Zeng, G. R.

嘿嘿嘿,正好宣传一下自己组里的论文(我就是划水的,不必在意)。大家在分析股票的时候,其实都会考虑一个问题,就是——趋势,然而仔细想想什么是趋势?有具体的定义吗,什么叫做升,什么叫做涨,有没有很准确的定量分析,答案是,没有。这篇文章给出了比较准确和严谨的定义,同时拓展了“趋势”的外延,趋势不一定就是涨或者是跌,涨跌也有不同的程度,本文通过数值模拟求出了比较准确的趋势,实证分析表明具有较高的准确性,要研究有关趋势的问题,可以参考一下这篇文章。

An intraday market risk management approach based on textual analysis

Groth, S. S., & Muntermann, J.

本文用TF-IDF对文本进行特征抽取,构建风险分析模型与文本进行匹配,然后运用常用的分类方法,SVM,KNN,NNet,NB进行分类,在高频情况下,文本(非结构化)信息对风险的预测有较好的效果(其实数据看起来一般,应该和特征提取有关,有提升空间),可供参考。个人认为值得推荐的点两个,一个是针对高频数据进行分析,在高频分析领域有一定意义,另一点是研究对象不是价格而是风险,意义和价格本身有区别。

最后侃几句

NLP是一个很大的学科,里面涵盖大量的分支,具体的介绍点击这里,但是问题是对一个人而言精力有限,想要入坑最好找到一个自己比较喜欢的切入点,翻译,句法,情感等等,而不是太泛泛地说自然语言处理,而是要实现的某个功能,解决的什么问题。

在金融市场、股票市场,有不少人开始尝试用NLP技术挖掘新闻、社论之中的信息,来解释甚至预测股票价格实现买卖决策等目标,时间也持续的比较长,但是仍然有一些空间去分析和研究,有一定前景和意义。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存