摘要: 理解决策树 决策树是随机森林的基本构成要素,而且是一种直观的模型。我们可以将决策树视为一系列关于数据的是/否问题,从而最终得出一个预测类别(或回归情况下的连续值)。 这是一个可解释的模型,因为它非常像我们人类进行分类的过程:在我们做出决定之前(在理想世界中),我们会对可用数据进行一系列的询问。 决策 阅读全文
posted @ 2020-02-15 19:35 徐同学 阅读(292) 评论(0) 推荐(0)
摘要: 通过第一幅图我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。此类情况称为欠拟合(underfitting),或者叫作叫做高偏差(bias)。 通过第二幅图,我们在中间加入一个二次项,也就是说对于这幅数据我们用二次函数去拟合。自然,可以拟合出一条曲线,事实也证明这个拟合效果很好 阅读全文
posted @ 2020-02-14 20:45 徐同学 阅读(104) 评论(0) 推荐(0)
摘要: 逻辑回归 (LR) 是分类的重要方法之一. 标准逻辑回归使用输入变量的系数加权线性组合来分类.相较于支持向量机, 自某一给定的类上, 标准逻辑回归能给出相应的类分布估计, 并且在模型训练时间上也占很大优势. 此外, 标准逻辑回归比支持向量机更容易扩展到多类分类. 美中不足的是, 标准逻辑回归是线性的 阅读全文
posted @ 2020-02-13 21:17 徐同学 阅读(114) 评论(0) 推荐(0)
摘要: 1、监督学习 是有特征和标签的,即便是没有标签的,机器也是可以通过特征和标签之间的关系,判断出标签。监督学习是通过训练让机器自己找到特征和标签之间的联系,在以后面对只有特征而没有标签的数据时可以自己判别出标签。相当于给定数据,预测标签。常见的有监督学习算法:回归分析和统计分类。 2、非监督学习 由于 阅读全文
posted @ 2019-12-14 19:46 徐同学 阅读(1260) 评论(5) 推荐(0)