机器学习股票预测——学习笔记
商业股票数据
线性回归
岭回归:
使用二范数:
适合少样本稀疏数据,保留每个样本属性。
分类和回归树:
信息增益
每次树分节点时,样本是有放回采样
xgboost:extreme极度,求导时残差有泰勒展开。
GBDT:极度梯度决策树,残差方向求导。
过拟合的原因:
正常情况,训练集和测试集都应下降
但是训练集下降,测试集会反而上升。
设置早停机制,early stop防止过拟合。
ζั͡ޓއ genji - 至此只为原地流浪.......