2021综述
21年的综述最近读了3篇,总结笔记如下:
本期综述论文链接:2021综述 https://www.alipan.com/s/Ev7a1a3f4nD 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。
本期筛选的论文及代码链接都整理在公众号-想啃论文了
(2021)Systematic Literature Review: Stock Price Prediction Using Machine Learning and Deep Learning
评价:原文不值得看,精华是下面那4篇论文。但这篇综述的写法比较典型,都是先描述问题,搜解决策略(按关键字搜、按数据源搜比如某个领域的期刊),设定过滤论文的标准。想水综述的可以借鉴文章结构。
内容太浅显,找了2016~2021的40篇,table3展示了性能最好的4篇论文。这四篇都没代码,但搜ref24时找到一篇研究情绪分析的论文,有代码:https://paperswithcode.com/paper/stockemotions-discover-investor-emotions-for
ref15 MLP,Technical,准确率71.63%.O. B. Sezer, M. Ozbayoglu, and E. Dogdu, “A Deep Neural-Network Based Stock Trading System Based on Evolutionary Optimized Technical Analysis Parameters,” in Procedia Computer Science, 2017, vol. 114, pp. 473–480, doi: 10.1016/j.procs.2017.09.031.
ref33 ANN,Technical,RMSE 0.0348,Universitas Telkom, Multimedia University, M.IEEE Systems, and Institute of Electrical and Electronics Engineers, Prediction of Agriculture and Mining Stock Value Listed in Kompas100 Index Using Artificial Neural Network Backpropagation
ref24 LSTM,Technical and Sentiment (Twitter),准确率70%.V. Sharma, R. Khemnar, R. Kumari, and D. B. R. Mohan, “Time Series with Sentiment Analysis for Stock Price Prediction,” 2019 2nd Int. Conf.Intell. Commun. Comput. Tech. Manipal Univ.Jaipur, Sep. 28-29, 2019
ref13 Random Forest,Fundamental,66.30%.L. S, “Impact of Financial Ratios and Technical Analysis on Stock Price Prediction Using Random Forests,” Ethical Integr. Comput. Drone Technol. Humanit. Sustain. 9th-11th Nov. 2017, Kuching, Sarawak, Malaysia, 2017.
(2021)Machine Learning in Financial Market Surveillance: A Survey
评价:异常推断我第一次接触,但感觉在处理数据阶段会用到。
这篇论文主要讲对金融市场中的异常行为进行监控(探测,推断)的方法。
股票预测有四个问题:
模型很难预测异常行为,因为这些行为在训练集中极少。
分辨异常行为和正常行为需要定义边界,但这个边界往往是模糊的。
数据产生、收集、处理 等过程会有噪音,导致预测异常更难
一个市场事件会引发连锁反应,所以要关注一个事件所在的一段时间内的情况。
ref17 2021 异常推断。 用准确率召回率评估异常推断方法的性能
table1 是对市场操纵的推断,最前沿的几篇论文
table2 是对输入的时序数据的异常推断
作者以电力数据为例对比了几个机器学习方法进行异常推断的效果,结论是Quantile Regression Forest 2006,Gradient Boosting Regressor 2002,Extra Tree Regressor 2006这三个方法效果最好。
下面是我筛选出的论文及代码链接:
table1 ref50: S. Das, W.-K. Wong, A. Fern, T. G. Dietterich, and M. A. Siddiqui,‘‘Incorporating feedback into tree-based anomaly detection,’’ 2017,arXiv:1708.09441.
https://paperswithcode.com/paper/incorporating-feedback-into-tree-based
table2 ref69: L. Zhu and N. Laptev, ‘‘Deep and confident prediction for time series at Uber,’’ in Proc. IEEE Int. Conf. Data Mining Workshops (ICDMW), Nov. 2017, pp. 103–110
https://paperswithcode.com/paper/deep-and-confident-prediction-for-time-series
table2 ref70: M. Munir, S. A. Siddiqui, A. Dengel, and S. Ahmed, ‘‘DeepAnT: A deep learning approach for unsupervised anomaly detection in time series,’’IEEE Access, vol. 7, pp. 1991–2005, 2018.
https://paperswithcode.com/paper/deepant-a-deep-learning-approach-for
table2 ref71: C. Zhang, S. Li, H. Zhang, and Y. Chen, ‘‘VELC: A new variational AutoEncoder based model for time series anomaly detection,’’ 2019,arXiv:1907.01702.
https://paperswithcode.com/paper/time-series-anomaly-detection-with
(2021)Artificial Intelligence Applied to Stock Market Trading: A Review
评价:值得精读,讲得细致,有条理
AI用于金融市场是从1990年代开始的,作者找了1995~2019的2326篇论文,文章分4类:资产组合优化、预测、情绪分析、组合前面两种或三种。
table2是ai预测金融领域每年引用最高的(最近几年的值得看,其他太久远了) ref 63,11,17,26,51
table3介绍了一些期刊
1、资产组合优化:
Markowitz在1954年提出The Modern Portfolio Theory (MPT),并提出投资组合风险的概念,
作者找了693篇资产组合优化的论文,table4是按引用的排序 ref16,75,40,23,46 ,ref23不明觉厉,ref43、25感觉不错。
这部分讲得挺细致,以后弄完策略,抽时间仔细研究一些这些资产组合优化方法,出个方案。
ref63: J. Patel, S. Shah, P. Thakkar, and K. Kotecha, ‘‘Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques,’’ Expert Syst. Appl., vol. 42, no. 1,pp. 259–268, Jan. 2015. [Online]. Available: http://www.sciencedirect.com/science/article/pii/S0957417414004473 一区1136引用
ref25: G. H. M. Mendonça, F. G. D. C. Ferreira, R. T. N. Cardoso,and F. V. C. Martins, ‘‘Multi-attribute decision making applied
to financial portfolio optimization problem,’’ Expert Syst. Appl.,vol. 158, Nov. 2020, Art. no. 113527. [Online]. Available: http://www.
sciencedirect.com/science/article/pii/S0957417420303511一区
2、预测:
table9引用排行,跟table2一样的。作者按实践顺序把table9的论文概括了一遍。
table12展示了这些论文通用的方法:
包括使用机器学习(ML)算法进行预测,用启发式算法进行预测或提高预测器的准确性或速度,模糊系统用于改进预测器或做出交易决策,预测前的数据聚类,不同预测器或分类器的集成或组合,用验证步骤来优化模型超参数。
3、情绪分析:
table13引用排行,ref62,5。
62 V. Pagolu, K. Reddy, G. Panda, and B. Majhi, ‘‘Sentiment analysis of Twitter data for predicting stock market movements,’’ in Proc. Int. Conf.Signal Process., Commun., Power Embedded Syst., 2017, pp. 1345–1350.
5 R. Batra and S. M. Daudpota, ‘‘Integrating StockTwits with sentiment analysis for better prediction of stock price movement,’’ in Proc. Int. Conf.Comput., Math. Eng. Technol., Jan. 2018, pp. 1–5
4、组合方法:
ref67 组合情绪分析和预测 准确率80~90%。
作者说组合方法的性能要优于单个方法,但这方面的论文还不多,比较新。
67 R. Ren, D. D. Wu, and T. Liu, ‘‘Forecasting stock market movement direction using sentiment analysis and support vector machine,’’ IEEE Syst.J., vol. 13, no. 1, pp. 760–770, Mar. 2019.
作者总结:
资产组合优化模型越来越复杂,需要fast methods,
预测方面需要把更多特征加入到模型,比如technical and fundamentalist indicators,
情绪分析很少有人把新闻和下面的评论综合起来。
-------------正文结束-------------
我的研究方向是机器学习在金融预测领域的应用,啃论文是体力活,大家资源共享能少走弯路,
我筛选出的所有论文及代码链接,都放在公众号-想啃论文了,
里面还有我开发的机器人,用于实盘验证论文策略,并输出交易信号,大家可免费使用,仅供科研交流。