21年的综述最近读了3篇,总结笔记如下:

(2021)Systematic Literature Review: Stock Price Prediction Using Machine Learning and Deep Learning
评价:原文不值得看,精华是下面那4篇论文。但这篇综述的写法比较典型,都是先描述问题,搜解决策略(按关键字搜、按数据源搜比如某个领域的期刊),设定过滤论文的标准。想水综述的可以借鉴文章结构。
内容太浅显,找了2016~2021的40篇,table3展示了性能最好的4篇论文。这四篇都没代码,但搜ref24时找到一篇研究情绪分析的论文,有代码:https://paperswithcode.com/paper/stockemotions-discover-investor-emotions-for

ref15 MLP,Technical,准确率71.63%.O. B. Sezer, M. Ozbayoglu, and E. Dogdu, “A Deep Neural-Network Based Stock Trading System Based on Evolutionary Optimized Technical Analysis Parameters,” in Procedia Computer Science, 2017, vol. 114, pp. 473–480, doi: 10.1016/j.procs.2017.09.031.

ref33 ANN,Technical,RMSE 0.0348,Universitas Telkom, Multimedia University, M.IEEE Systems, and Institute of Electrical and Electronics Engineers, Prediction of Agriculture and Mining Stock Value Listed in Kompas100 Index Using Artificial Neural Network Backpropagation

ref24 LSTM,Technical and Sentiment (Twitter),准确率70%.V. Sharma, R. Khemnar, R. Kumari, and D. B. R. Mohan, “Time Series with Sentiment Analysis for Stock Price Prediction,” 2019 2nd Int. Conf.Intell. Commun. Comput. Tech. Manipal Univ.Jaipur, Sep. 28-29, 2019

ref13 Random Forest,Fundamental,66.30%.L. S, “Impact of Financial Ratios and Technical Analysis on Stock Price Prediction Using Random Forests,” Ethical Integr. Comput. Drone Technol. Humanit. Sustain. 9th-11th Nov. 2017, Kuching, Sarawak, Malaysia, 2017.

(2021)Machine Learning in Financial Market Surveillance: A Survey
评价:异常推断我第一次接触,但感觉在处理数据阶段会用到。
这篇论文主要讲对金融市场中的异常行为进行监控(探测,推断)的方法。
股票预测有四个问题:
  模型很难预测异常行为,因为这些行为在训练集中极少。
  分辨异常行为和正常行为需要定义边界,但这个边界往往是模糊的。
  数据产生、收集、处理 等过程会有噪音,导致预测异常更难
  一个市场事件会引发连锁反应,所以要关注一个事件所在的一段时间内的情况。
ref17 2021 异常推断。 用准确率召回率评估异常推断方法的性能
table1 是对市场操纵的推断,最前沿的几篇论文
table2 是对输入的时序数据的异常推断
作者以电力数据为例对比了几个机器学习方法进行异常推断的效果,结论是Quantile Regression Forest 2006,Gradient Boosting Regressor 2002,Extra Tree Regressor 2006这三个方法效果最好。

下面是我筛选出的论文及代码链接

table1 ref50:  S. Das, W.-K. Wong, A. Fern, T. G. Dietterich, and M. A. Siddiqui,‘‘Incorporating feedback into tree-based anomaly detection,’’ 2017,arXiv:1708.09441.
https://paperswithcode.com/paper/incorporating-feedback-into-tree-based

table2 ref69: L. Zhu and N. Laptev, ‘‘Deep and confident prediction for time series at Uber,’’ in Proc. IEEE Int. Conf. Data Mining Workshops (ICDMW), Nov. 2017, pp. 103–110
https://paperswithcode.com/paper/deep-and-confident-prediction-for-time-series

table2 ref70:  M. Munir, S. A. Siddiqui, A. Dengel, and S. Ahmed, ‘‘DeepAnT: A deep learning approach for unsupervised anomaly detection in time series,’’IEEE Access, vol. 7, pp. 1991–2005, 2018.
https://paperswithcode.com/paper/deepant-a-deep-learning-approach-for

table2 ref71:  C. Zhang, S. Li, H. Zhang, and Y. Chen, ‘‘VELC: A new variational AutoEncoder based model for time series anomaly detection,’’ 2019,arXiv:1907.01702.
https://paperswithcode.com/paper/time-series-anomaly-detection-with

(2021)Artificial Intelligence Applied to Stock Market Trading: A Review
评价:值得精读,讲得细致,有条理
AI用于金融市场是从1990年代开始的,作者找了1995~2019的2326篇论文,文章分4类:资产组合优化、预测、情绪分析、组合前面两种或三种。
table2是ai预测金融领域每年引用最高的(最近几年的值得看,其他太久远了) ref 63,11,17,26,51
table3介绍了一些期刊
1、资产组合优化:

Markowitz在1954年提出The Modern Portfolio Theory (MPT),并提出投资组合风险的概念,
作者找了693篇资产组合优化的论文,table4是按引用的排序 ref16,75,40,23,46 ,ref23不明觉厉,ref43、25感觉不错。
这部分讲得挺细致,以后弄完策略,抽时间仔细研究一些这些资产组合优化方法,出个方案。
ref63:  J. Patel, S. Shah, P. Thakkar, and K. Kotecha, ‘‘Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques,’’ Expert Syst. Appl., vol. 42, no. 1,pp. 259–268, Jan. 2015. [Online]. Available: http://www.sciencedirect.com/science/article/pii/S0957417414004473   一区1136引用

ref25:  G. H. M. Mendonça, F. G. D. C. Ferreira, R. T. N. Cardoso,and F. V. C. Martins, ‘‘Multi-attribute decision making applied

to financial portfolio optimization problem,’’ Expert Syst. Appl.,vol. 158, Nov. 2020, Art. no. 113527. [Online]. Available: http://www.
sciencedirect.com/science/article/pii/S0957417420303511一区

2、预测:
table9引用排行,跟table2一样的。作者按实践顺序把table9的论文概括了一遍。
table12展示了这些论文通用的方法:
包括使用机器学习(ML)算法进行预测,用启发式算法进行预测或提高预测器的准确性或速度,模糊系统用于改进预测器或做出交易决策,预测前的数据聚类,不同预测器或分类器的集成或组合,用验证步骤来优化模型超参数。

3、情绪分析:
table13引用排行,ref62,5。
62 V. Pagolu, K. Reddy, G. Panda, and B. Majhi, ‘‘Sentiment analysis of Twitter data for predicting stock market movements,’’ in Proc. Int. Conf.Signal Process., Commun., Power Embedded Syst., 2017, pp. 1345–1350.
5 R. Batra and S. M. Daudpota, ‘‘Integrating StockTwits with sentiment analysis for better prediction of stock price movement,’’ in Proc. Int. Conf.Comput., Math. Eng. Technol., Jan. 2018, pp. 1–5

4、组合方法:
ref67 组合情绪分析和预测 准确率80~90%。
作者说组合方法的性能要优于单个方法,但这方面的论文还不多,比较新。
67 R. Ren, D. D. Wu, and T. Liu, ‘‘Forecasting stock market movement direction using sentiment analysis and support vector machine,’’ IEEE Syst.J., vol. 13, no. 1, pp. 760–770, Mar. 2019.

作者总结:

资产组合优化模型越来越复杂,需要fast methods,
预测方面需要把更多特征加入到模型,比如technical and fundamentalist indicators,
情绪分析很少有人把新闻和下面的评论综合起来。

-------------正文结束-------------
我的研究方向是机器学习在金融预测领域的应用,啃论文是体力活,大家资源共享能少走弯路,
我筛选出的所有论文及代码链接,都放在公众号-想啃论文了
里面还有我开发的机器人,用于实盘验证论文策略,并输出交易信号,大家可免费使用,仅供科研交流。

AI金融预测领域综述文章筛选,附论文及代码链接,2021年版的更多相关文章

  1. (转) 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文)

    本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 201 ...

  2. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)

    100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...

  3. (转) 干货 | 图解LSTM神经网络架构及其11种变体(附论文)

    干货 | 图解LSTM神经网络架构及其11种变体(附论文) 2016-10-02 机器之心 选自FastML 作者:Zygmunt Z. 机器之心编译  参与:老红.李亚洲 就像雨季后非洲大草原许多野 ...

  4. (转) AI突破性论文及代码实现汇总

    本文转自:https://zhuanlan.zhihu.com/p/25191377 AI突破性论文及代码实现汇总 极视角 · 2 天前 What Can AI Do For You? “The bu ...

  5. 自动曝光修复算法 附完整C代码

    众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...

  6. google在nature上发表的关于量子计算机的论文(Quantum supremacy using a programmable superconducting processor 译)— 附论文

    Google 2019年10月23号发表在Nature(<自然><科学>及<细胞>杂志都是国际顶级期刊,貌似在上面发文两篇,就可以评院士了)上,关于量子计算(基于 ...

  7. Java架构师方案—多数据源开发详解及原理(二)(附完整项目代码)

    1. mybatis下数据源开发工作 2. 数据源与DAO的关系原理模型 3. 为什么要配置SqlSessionTemplate类的bean 4. 多数据源应用测试 1. mybatis下数据源开发工 ...

  8. C# 读取Word文本框中的文本、图片和表格(附VB.NET代码)

    [概述] Word中可插入文本框,在文本框中可添加文本.图片.表格等内容.本篇文章通过C#程序代码介绍如何来读取文本框中的文本.图片和表格等内容.附VB.NET代码,有需要可作参考. [程序环境] 程 ...

  9. [ZZ]计算机视觉、机器学习相关领域论文和源代码大集合

    原文地址:[ZZ]计算机视觉.机器学习相关领域论文和源代码大集合作者:计算机视觉与模式 注:下面有project网站的大部分都有paper和相应的code.Code一般是C/C++或者Matlab代码 ...

  10. 深入一致性哈希(Consistent Hashing)算法原理,并附100行代码实现

    转自:https://my.oschina.net/yaohonv/blog/1610096 本文为实现分布式任务调度系统中用到的一些关键技术点分享——Consistent Hashing算法原理和J ...

随机推荐

  1. CF1425F Flamingoes of Mystery 题解

    题目传送门 前置知识 前缀和 & 差分 解法 令 \(sum_k=\sum\limits_{i=1}^{k} a_k\).考虑分别输入 \(sum_2 \sim sum_n\),故可以由于差分 ...

  2. 计算机算法设计与分析(第5版)PDF

    <计算机算法设计与分析(第5版)>是2018年电子工业出版社出版的图书,作者是王晓东. 整本书的结构是:先介绍算法设计策略思想,然后从解决经典算法问题来学习,通过实践的方式去学习算法. 网 ...

  3. Ubuntu20.04下的ESP8266环境

    硬件说明 ESP8266使用的是3.3V供电, 和Arduino不一样, ESP8266的I/O脚是不能防5V的, 连上就烧. 其输出只有12mA, 而Arduino是20-40mA. ESP8266 ...

  4. Java并发编程实例--15.在同步代码块中使用条件

    并发编程中有个经典问题: 生产消费者问题. 我们有一个数据缓冲区,一个或多个生产者往其中存入对象,另外一个或多个消费者从中取走. 因此,该数据缓冲区是一个共享数据结构,我们需要对其添加读取同步机制,但 ...

  5. win32-使用FillRect绘制具有渐变颜色的客户区域背景

    void OnEraseBkGnd(HWND hwnd) { /* Vars */ HDC dc; /* Standard Device Context; used to do the paintin ...

  6. RabbitMQ零碎整理,总有一天在你工作中会用到

    概念 MQ:消息队列(消息中间件),开源的基于AMQP协议的消息中间件,异步 解耦 削峰 核心作用:1.异步 2.解耦 3.消息通信 RabbitMQ 消息的类型:1.点对点 2.Worker 3.发 ...

  7. 「实操」结合图数据库、图算法、机器学习、GNN 实现一个推荐系统

    本文是一个基于 NebulaGraph 上图算法.图数据库.机器学习.GNN 的推荐系统方法综述,大部分介绍的方法提供了 Playground 供大家学习. 基本概念 推荐系统诞生的初衷是解决互联网时 ...

  8. 想做大模型开发前,先来了解一下MoE

    为了实现大模型的高效训练和推理,混合专家模型MoE便横空出世. 大模型发展即将进入下一阶段但目前仍面临众多难题.为满足与日俱增的实际需求,大模型参数会越来越大,数据集类型越来越多,从而导致训练难度大增 ...

  9. C++socket中select函数

    文章参考 https://www.cnblogs.com/shmilxu/p/4835873.html

  10. Server-side template injection 模板注入问题总结

    概念: 服务器模板注入(Server-side template injection) 攻击者能够使用本地的模板语法去注入一个恶意的payload,然后在服务器端执行该攻击,当与欧股直接输入数据到模板 ...