摘要: 一、Hard Voting 与 Soft Voting 的对比 1)使用方式 voting = 'hard':表示最终决策方式为 Hard Voting Classifier; voting = 'soft':表示最终决策方式为 Soft Voting Classifier; 2)思想 Hard V 阅读全文
posted @ 2018-08-15 18:02 何永灿 阅读(17164) 评论(0) 推荐(2) 编辑
摘要: 一、集成学习的思想 集成学习的思路:一个问题(如分类问题),让多种算法参与预测(如下图中的算法都可以解决分类问题),在多个预测结果中,选择出现最多的预测类别做为该样本的最终预测类别; 生活中的集成思维: 二、scikit-learn 中的集成分类器 scikit-learn 中封装的集成分类器:Vo 阅读全文
posted @ 2018-08-15 16:33 何永灿 阅读(1097) 评论(0) 推荐(0) 编辑
摘要: 一、解决回归问题的思路 1)思路对比 解决分类问题:根据模型参数训练结束后,对每个“叶子”节点的样本数据进行投票,规定数量最多的样本的类型为该“叶子”的预测类型; 解决回归问题:根据模型参数划分结束后,对每个“叶子”节点处 的相应的数据输出值的平均值,作为该“叶子”的预测值;(也就是训练结束后,每个 阅读全文
posted @ 2018-08-15 15:21 何永灿 阅读(1410) 评论(0) 推荐(0) 编辑
摘要: 老师:非参数学习的算法都容易产生过拟合; 一、决策树模型的创建方式、时间复杂度 1)创建方式 决策树算法 2)二叉树的实际复杂度 预测样本时的时间复杂度:O(logm) 训练决策树模型时的时间复杂度:O(n*m*logm) 二、scikit-learn 中决策树算法的参数 1)决策树算法的问题 方案 阅读全文
posted @ 2018-08-15 11:29 何永灿 阅读(2378) 评论(0) 推荐(1) 编辑