导航

2019年9月11日

摘要: Adaboost分类器 2019-08-31 非集成的机器学习算法就像古代皇帝一样,一个人说了算;集成学习算法类似于现在的国会,需要听取在会所有人的意见。 Adaboost是一个集成学习算法,下面将会对算法进行拆解,以使我们明白Adaboost的内部原理。 Adboost算法核心内容可以划分为两个问 阅读全文

posted @ 2019-09-11 12:35 司恩波 阅读(534) 评论(0) 推荐(0) 编辑

摘要: 模型性能评估 模型性能评估是为了评价模型的泛化能力,模型性能评估主要有两个问题要解决: 1)用什么数据来评估? 2)用什么标准来评估? 下面的第一节内容主要解答用什么数据来评估模型的性能,第二节解答用什么标准来评估。 1.用什么数据来评估模型性能 常用的有3中,按照复杂程度程度排序分别为: 1)训练 阅读全文

posted @ 2019-09-11 11:12 司恩波 阅读(1158) 评论(0) 推荐(0) 编辑

摘要: 特征提取(机器学习数据预处理) 特征提取与特征选择都是数据降维的技术,不过二者有着本质上的区别;特征选择能够保持数据的原始特征,最终得到的降维数据其实是原数据集的一个子集;而特征提取会通过数据转换或数据映射得到一个新的特征空间,尽管新的特征空间是在原特征基础上得来的,但是凭借人眼观察可能看不出新数据 阅读全文

posted @ 2019-09-11 10:50 司恩波 阅读(17561) 评论(0) 推荐(1) 编辑

摘要: 决策树(DecisionTree) 决策树所属类别:监督学习,分类 优点:直观易懂,算法简单 缺点:容易过拟合,对连续型数据不太容易实现 实现方案:ID3,CART,C4.5 详细的资料见连接:别人写的很详细的决策树 这篇博客主要把重点放在决策树程序的实现上,也仅实现了ID3算法,对其他两个算法仅作 阅读全文

posted @ 2019-09-11 10:16 司恩波 阅读(1314) 评论(0) 推荐(0) 编辑

摘要: 支持向量机(SVM) 算法分类:监督算法,分类算法 1.SVM算法简介 SVM是分类算法中比较特殊的一种,它并不像LR算法那样使用到所有数据进行模型训练,SVM虽然也使用了全部数据,但是绝大部分数据只参与约束条件的限制,不参与最终模型参数的训练。SVM的目标是分类最大化分类间隔,何为最大化分类间隔, 阅读全文

posted @ 2019-09-11 09:09 司恩波 阅读(417) 评论(0) 推荐(0) 编辑