会飞的蝌蚪君

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年11月4日

摘要: 以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法: 一、C4.5C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法,ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每 阅读全文
posted @ 2017-11-04 14:03 会飞的蝌蚪 阅读(1428) 评论(0) 推荐(0) 编辑

摘要: 过拟合原因 数据:数据不规范,数据量少,数据穿越,统计特征用到了未来的信息或者标签信息 算法:算法过于复杂 解决: 1、将数据规范化,处理缺失值,增加数据量,采样,添加噪声数据 2、正则化,控制模型复杂程度, 3、early stoping,减少迭代次数,减少树的深度, 4、学习率调大/小点、 5、 阅读全文
posted @ 2017-11-04 12:10 会飞的蝌蚪 阅读(267) 评论(0) 推荐(0) 编辑