摘要: 学习内容: 1.CART树 2.算法原理 3.损失函数 4.分裂结点算法 5.正则化 6.对缺失值处理 7.优缺点 8.应用场景 9.sklearn参数 1.CART树 CART算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个非叶子结点都有两个分支,因此CART算法生成的决策树 阅读全文
posted @ 2019-03-04 21:07 burton_shi 阅读(3130) 评论(0) 推荐(0) 编辑
摘要: 学习内容: 1. 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 2.决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景 3. 回归树原理 4. 决策树防止过拟合手段 5. 模型评估 6. sklearn参数详解,Python绘制决策树 1. 信息论基础(熵 联合熵 阅读全文
posted @ 2019-03-04 18:44 burton_shi 阅读(610) 评论(0) 推荐(0) 编辑
摘要: 学习内容: 1、逻辑回归与线性回归的联系与区别 2、 逻辑回归的原理 3、逻辑回归损失函数推导及优化 4、 正则化与模型评估指标 5、逻辑回归的优缺点 6、样本不均衡问题解决办法 7. sklearn参数 转自:https://github.com/trembous/homework_summary 阅读全文
posted @ 2019-03-04 11:48 burton_shi 阅读(1264) 评论(0) 推荐(0) 编辑
摘要: 学习内容: 前向分布算法 负梯度拟合 损失函数 回归 二分类,多分类 正则化 优缺点 sklearn参数 应用场景 转自:https://zhuanlan.zhihu.com/p/58105824 GBDT是一种采用加法模型(即基函数的线性组合)与前向分步算法并以决策树作为基函数的提升方法。通俗来说 阅读全文
posted @ 2019-03-04 10:43 burton_shi 阅读(627) 评论(0) 推荐(0) 编辑