摘要: 一、随机森林是什么? 随机森林是一种多功能的机器学习算法,能够执行①回归和②分类的任务,同时也是一种③数据降维手段,用于处理缺失值、异常值等担任了集成学习中的重要方法,可以将④几个低效模型整合为一个高效模型 在随机森林中,我们将生成很多的决策树,并不像在CART模型中只生成唯一的树1)分类 => 当 阅读全文
posted @ 2020-11-05 23:33 PEAR2020 阅读(1425) 评论(0) 推荐(0) 编辑
摘要: 一、熵、条件熵、信息增益 数学概念:https://zhuanlan.zhihu.com/p/41134986 二、决策树分类 我们在构造决策树的时候,会基于纯度来构建。而经典的 “不纯度”的指标有三种,分别是信息增益(ID3 算法)、信息增益率(C4.5 算法)以及基尼指数(Cart 算法)。信息 阅读全文
posted @ 2020-11-05 16:59 PEAR2020 阅读(125) 评论(0) 推荐(0) 编辑