机器学习股票预测——学习笔记

商业股票数据

线性回归

岭回归:

使用二范数:

适合少样本稀疏数据,保留每个样本属性。

分类和回归树:

 

信息增益

每次树分节点时,样本是有放回采样

 

xgboost:extreme极度,求导时残差有泰勒展开。

GBDT:极度梯度决策树,残差方向求导。

过拟合的原因:

正常情况,训练集和测试集都应下降

但是训练集下降,测试集会反而上升。

 

设置早停机制,early stop防止过拟合。

 

posted @ 2019-03-04 20:47  ostartech  阅读(489)  评论(0编辑  收藏  举报