摘要: 一,引言 尽管线性回归包含了一些强大的方法,但这些方法创建的模型需要拟合所有的样本数据。当数据拥有众多特征并且特征之间的关系比较复杂时,构建全局线性模型就会非常困难。并且,在实际生活中很多问题都是非线性的,很难通过全局线性模型来拟合所有数据。 解决上述非线性数据的拟合问题的一个可行的方法是,将数据集 阅读全文
posted @ 2017-06-11 18:45 卑微的蜗牛 阅读(7159) 评论(0) 推荐(1) 编辑
摘要: 一,引言 前面讲到的基本都是分类问题,分类问题的目标变量是标称型数据,或者离散型数据。而回归的目标变量为连续型,也即是回归对连续型变量做出预测,最直接的办法是依据输入写出一个目标值的计算公式,这样,对于给定的输入,利用该公式可以计算出相应的预测输出。这个公式称为回归方程,而求回归方程显然就是求该方程 阅读全文
posted @ 2017-06-06 00:25 卑微的蜗牛 阅读(7301) 评论(0) 推荐(0) 编辑
摘要: 一,引言 在前面六个分类算法中,都假设了最后所有的预测类别的分类代价是一样的。但是,在实际中却并非如此,往往不同的决策结果所带来的影响和代价是不一样的。比如,第五章的实例,预测患马疝病的马匹是否死亡的结果,显然,死亡和不死亡的代价不同,毕竟马匹也是有生命的存在,更何况还有跟人类之间的感情。所以,当算 阅读全文
posted @ 2017-05-31 14:23 卑微的蜗牛 阅读(1203) 评论(0) 推荐(0) 编辑
摘要: 一,引言 前面几章的介绍了几种分类算法,当然各有优缺。如果将这些不同的分类器组合起来,就构成了我们今天要介绍的集成方法或者说元算法。集成方法有多种形式:可以使多种算法的集成,也可以是一种算法在不同设置下的集成,还可以将数据集的不同部分分配不同的分类器,再将这些分类器进行集成。 adaBoost分类器 阅读全文
posted @ 2017-05-26 16:38 卑微的蜗牛 阅读(44513) 评论(1) 推荐(1) 编辑
摘要: 一引言: 支持向量机这部分确实很多,想要真正的去理解它,不仅仅知道理论,还要进行相关的代码编写和测试,二者想和结合,才能更好的帮助我们理解SVM这一非常优秀的分类算法 支持向量机是一种二类分类算法,假设一个平面可以将所有的样本分为两类,位于正侧的样本为一类,值为+1,而位于负一侧的样本为另外一类,值 阅读全文
posted @ 2017-05-25 09:25 卑微的蜗牛 阅读(27907) 评论(3) 推荐(3) 编辑
摘要: 一,引言 假设我们现有一些数据点,我们用一条直线对这些点进行拟合,这个拟合的过程就称作回归。利用logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。 我们知道,logistic回归主要是进行二分类预测,也即是对于0~1之间的概率值,当概率大于0.5预测为1, 阅读全文
posted @ 2017-05-18 19:21 卑微的蜗牛 阅读(20621) 评论(1) 推荐(2) 编辑
摘要: 一,引言 前两章的KNN分类算法和决策树分类算法最终都是预测出实例的确定的分类结果,但是,有时候分类器会产生错误结果;本章要学的朴素贝叶斯分类算法则是给出一个最优的猜测结果,同时给出猜测的概率估计值。 1 准备知识:条件概率公式 相信学过概率论的同学对于概率论绝对不会陌生,如果一时觉得生疏,可以查阅 阅读全文
posted @ 2017-05-12 21:09 卑微的蜗牛 阅读(14689) 评论(3) 推荐(3) 编辑
摘要: 一,引言: 上一章我们讲的kNN算法,虽然可以完成很多分类任务,但它最大的缺点是无法给出数据的内在含义,而决策树的主要优势就在于数据形式非常容易理解。决策树算法能够读取数据集合,决策树的一个重要任务是为了数据所蕴含的知识信息,因此,决策树可以使用不熟悉的数据集合,并从中提取一系列规则,在这些机器根据 阅读全文
posted @ 2017-05-05 15:32 卑微的蜗牛 阅读(14906) 评论(3) 推荐(3) 编辑
摘要: 机器学习实战这本书是基于python的,如果我们想要完成python开发,那么python的开发环境必不可少: (1)python3.52,64位,这是我用的python版本 (2)numpy 1.11.3,64位,这是python的科学计算包,是python的一个矩阵类型,包含数组和矩阵,提供了大 阅读全文
posted @ 2017-04-28 11:33 卑微的蜗牛 阅读(10837) 评论(4) 推荐(2) 编辑
摘要: 之前已经看过,李航的统计与学习方法,对于机器学习相关算法的理论有了一定的了解,但是感觉对于实际的代码编写还有所欠缺,然后就打算花时间将机器学习实战这本书好好看一下,顺便学习一下python 估计看本书的读者大多都会忽略本书的第一章节,但是第一章我也是认真的看了一遍,里面讲了机器学习的重要性,机器学习 阅读全文
posted @ 2017-04-27 17:37 卑微的蜗牛 阅读(3924) 评论(0) 推荐(1) 编辑