收藏!精品AI量化学习资料分享
作为一个AI量化学习者,可能很多人会有和我一样的感觉:问题不在于学习资源不够,而是“信息过载”。所以,我整理了一波AI量化精品资料,希望能和大家共同进步一起交流!
下面详细介绍和社区附件,大家按需享用~(如遇链接失效请前往[BigQuant社区](https://bigquant.com/wiki/home)
综合类与科普类
-
《AI量化零基础入门知识》
AI量化策略快速理解、因子工程是什么、量化投资;适合零基础初学者学习量化投资知识。 -
《Advances in Financial Machines Learning》
金融建模集大成教科书,数据分析 => 建模方法 => 回测方法 => 有效因子 => 前沿计算。英文版。 -
《Can Machines Learn Finance?》
AQR2019最新研究。金融大数据噪音多变化大,和机器学习广泛应用的语音识别/图像识别领域有着很大不同。那么,机器学习能否在金融领域发挥作用、提高资产投资效率呢?当前前沿的机器学习在金融业的应用和研究有哪些呢?这篇文章一一给出回答。
AQR Alternative Thinking 2Q19 Can Machines Learn Finance.pdf (1.5 MB) -
《Big Data and AI Strategies》
JP Morgan量化研究。从实际数据和机器学习方法两个角度,综合介绍大数据和AI在量化研究中的应用。非常适合了解性阅读,可以建立broad picture。
bigdata and ai strategys_JPM.pdf(6.0 MB) -
《人工智能选股框架及经典算法简介》
如题。
人工智能1:人工智能选股框架及经典算法简介20170601.pdf (3.2 MB) -
《History of AQR》
科普性读物,全球第二大对冲基金AQR介绍。
History of AQR.pdf (7.9 MB) -
《On becoming a quant》
想做Quant吗?这篇文章详尽解读了QUANT是什么,做什么,关注什么,运用什么方法。
On Becoming A Quant.pdf(143.4 KB)
机器学习方法与算法
-
《人工智能选股之数据标注方法实证》
监督学习中,如何为训练样本进行数据标注(data labeling)是一个非常重要的话题。由于数据标注的结果(数据标签)会直接作用于监督学习的目标函数(objective function),不同的数据标注方法会使得监督学习得出不同的训练和预测结果。结合机器学习在多因子选股中的运用,本文列出各种数据标注方法并进行系统的测试。
人工智能系列之十七:人工智能选股之数据标注方法实证.pdf (2.4 MB) -
《人工智能选股之损失函数的改进》
损失函数(loss function)是衡量样本预测值和真实值之间差距的函数,在机器学习模型的训练过程中决定了模型的优化方向,具有较高的研究价值。本文主要研究对数损失函数(logloss)。
人工智能系列之十三:人工智能选股之损失函数的改进.pdf(1.4 MB) -
《Pattern Recognition in Stock Data》
股票数据是典型的高维数据,识别其模式难度较大。此文运用了高斯过程,针对识别股票数据的模式提出了行之有效的方法论。
Pattern_Recognition_in_Stock_Data.pdf (869.3 KB) -
《Predicting the direction of stock market prices using tree-based classifiers》
树模型在股票投资中的运用。本文分别对比了基于bagging的随机森林和基于boosting的XGBoost算法。
Predicting the direction of stock market prices using tree-based.pdf(1002.8 KB) -
《对抗过拟合:从时序交叉验证谈起》
对人工智能及机器学习的广泛诟病之一在于过拟合:模型通常能完美地拟合样本内数据,但是对样本外数据集的泛化能力较弱。增加样本数量、选择合适算法、增加交叉验证都可以在一定程度上避免过拟合。本文主要关注交叉验证,通过比较传统交叉验证和时序交叉验证,对过拟合问题做出探究。
对抗过拟合:从时序交叉验证谈起20181128.pdf (1.7 MB) -
《再论时序交叉验证对抗过拟合》
本文证实了K 折交叉验证应用于时间序列数据存在模型过拟合的风险,而时序交叉验证能够降低过拟合程度。借助时序交叉验证的机器学习选股策略能够获得更高并且更稳定的收益。
再论时序交叉验证对抗过拟合20190218.pdf(1.5 MB) -
《人工智能选股之特征选择》
特征选择是人工智能选股策略的重要步骤,能够提升基学习器的预测效果;随着入选特征数的增加,模型预测效果先上升后下降;特征选择是预处理的重要步骤,意义在于减少时间开销,并避免过拟合。着重探讨基于特征选择的降维方法,并分别应用于不同基学习器,对模型的预测能力和构建的选股策略进行测试和对比。
人工智能系列之十二:人工智能选股之特征选择.pdf(2.7 MB) -
《基于遗传规划的智能交易策略方法》
CTA市场和策略介绍 => 遗传规划算法 => 遗传规划智能策略。
基于遗传规划的智能交易策略方法-120916.pdf(1.1 MB)
AI + 多因子
-
《多因子模型体系初探》
1)依次对不同类别的风格因子进行单因子测试;2)对筛选出的有效因子进行大类因子分析;3)在收益预测和风险预测的基础上,构建选股模型;4)对选股模型进行回测和绩效分析。
多因子系列之一:多因子模型体系初探.pdf(811.4 KB) -
《基于短周期价量特征的多因子选股体系》
本篇报告为投资者详尽介绍了全新的交易型阿尔法体系的构建思路 、策略特点及实证分析等研究成果。
基于短周期价量特征的多因子选股体系.pdf(3.6 MB) -
《基于遗传规划的选股因子挖掘》
通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用;针对因子挖掘问题,本文对遗传规划程序包gplearn 进行了深度定制改进;经过测试,遗传规划能从有限的量价数据中挖掘出具有增量信息的因子;遗传规划是一套灵活的框架,或许能为选股因子研究提供更多的可能性。
基于遗传规划的选股因子挖掘.pdf(3.4 MB) -
《中国A股市场量化因子白皮书》
清华大学五道口金融学院研究报告。本报告系统性地研究中国 A股超额收益的决定性因素,根据A股股票交易和财务报表数据构建了56个量化因子, 分为六大类,分别检验其有效性。
清华发布因子报告.pdf (4.8 MB) -
《人工智能融入多因子选股框架》
提供人工智能和多因子模型的融合思路:特征工程/海量生成因子;特征选择/因子的使用方式;算法简介;模型比较与探究。
人工智能融入多因子选股框架_20180330.pdf(1.4 MB) -
《101 Formulaic Alphas》
101 Alphas因子研究,原始英文论文,给出了101个常用因子的计算方法并进行了相应因子研究。经典可用。
101 Formulaic Alphas .pdf(382.2 KB) -
《FINDING ALPHAS: a quantitative approach to building trading strategies》
来自World Quant:如何寻找有效的ALPHA因子。手把手教学,适宜食用。
WorldQuant_FindingAlphas.pdf(4.3 MB)
本文来自BigQuant社区,转载请注明出处。