摘要: 一、决策树 1、基本流程 有三种情况会让递归停止:1、当前节点包含的样本属于同一类别,无需划分。2、属性集为空,所有样本在所有属性上取值都一致,返回的是这个节点样本最多的类别。3、当前节点样本为空,这时候返回父节点的样本最多的类别 2、划分选择 1)熵: 2)信息增益:,信息增益最大的就是最优的选择 阅读全文
posted @ 2018-03-13 17:06 杰哥哥是谁 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 官方文档:http://scikit-learn.org/stable/modules/linear_model.html 一、线性回归实践 1、导入相关库,并查看数据情况 2、对于预测的变量,查看分布情况 3、对于几个特征,查看与因变量的关系 结论:三个特征,前两个与销量呈现明显的线性关系,第三个 阅读全文
posted @ 2018-03-13 12:41 杰哥哥是谁 阅读(296) 评论(0) 推荐(0) 编辑