上一页 1 ··· 8 9 10 11 12 13 14 下一页
摘要: 支持向量机原理(一) 线性支持向量机 支持向量机原理(二) 线性支持向量机的软间隔最大化模型 支持向量机原理(三)线性不可分支持向量机与核函数 支持向量机原理(四)SMO算法原理 支持向量机原理(五)线性支持回归 支持向量机(Support Vecor Machine,以下简称SVM)虽然诞生只有短 阅读全文
posted @ 2016-11-24 21:33 刘建平Pinard 阅读(117011) 评论(124) 推荐(46) 编辑
摘要: 最大熵模型(maximum entropy model, MaxEnt)也是很典型的分类算法了,它和逻辑回归类似,都是属于对数线性分类模型。在损失函数优化的过程中,使用了和支持向量机类似的凸优化技术。而对熵的使用,让我们想起了决策树算法中的ID3和C4.5算法。理解了最大熵模型,对逻辑回归,支持向量 阅读全文
posted @ 2016-11-23 20:33 刘建平Pinard 阅读(51689) 评论(100) 推荐(15) 编辑
摘要: 之前在朴素贝叶斯算法原理小结这篇文章中,对朴素贝叶斯分类算法的原理做了一个总结。这里我们就从实战的角度来看朴素贝叶斯类库。重点讲述scikit-learn 朴素贝叶斯类库的使用要点和参数选择。 1. scikit-learn 朴素贝叶斯类库概述 朴素贝叶斯是一类比较简单的算法,scikit-lear 阅读全文
posted @ 2016-11-17 17:03 刘建平Pinard 阅读(56859) 评论(42) 推荐(22) 编辑
摘要: 在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数$Y=f(X)$,要么是条件分布$P(Y|X)$。但是朴素贝叶斯却是生成方法,也就是直 阅读全文
posted @ 2016-11-16 17:25 刘建平Pinard 阅读(130138) 评论(130) 推荐(48) 编辑
摘要: 在K近邻法(KNN)原理小结这篇文章,我们讨论了KNN的原理和优缺点,这里我们就从实践出发,对scikit-learn 中KNN相关的类库使用做一个小结。主要关注于类库调参时的一个经验总结。 1. scikit-learn 中KNN相关的类库概述 在scikit-learn 中,与近邻法这一大类相关 阅读全文
posted @ 2016-11-15 16:29 刘建平Pinard 阅读(38632) 评论(13) 推荐(10) 编辑
摘要: K近邻法(k-nearest neighbors,KNN)是一种很基本的机器学习方法了,在我们平常的生活中也会不自主的应用。比如,我们判断一个人的人品,只需要观察他来往最密切的几个人的人品好坏就可以得出了。这里就运用了KNN的思想。KNN方法既可以做分类,也可以做回归,这点和决策树算法相同。 KNN 阅读全文
posted @ 2016-11-14 20:13 刘建平Pinard 阅读(86724) 评论(87) 推荐(27) 编辑
摘要: 之前对决策树的算法原理做了总结,包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法,主要是讲解使用scikit-learn来跑决策树算法,结果的可视化以及一些参数调参的关键点。 1. scikit-learn决策树算法类库介绍 scikit-learn决策树算法类库内 阅读全文
posted @ 2016-11-12 14:28 刘建平Pinard 阅读(147933) 评论(137) 推荐(30) 编辑
摘要: 在决策树算法原理(上)这篇里,我们讲到了决策树里ID3算法,和ID3算法的改进版C4.5算法。对于C4.5算法,我们也提到了它的不足,比如模型是用较为复杂的熵来度量,使用了相对较为复杂的多叉树,只能处理分类不能处理回归等。对于这些问题, CART算法大部分做了改进。CART算法也就是我们下面的重点了 阅读全文
posted @ 2016-11-11 16:10 刘建平Pinard 阅读(128968) 评论(342) 推荐(51) 编辑
摘要: 决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。本文就对决策树算法原理做一个总结,上篇对ID3, C4.5的算法思想做了总结,下篇重点对CART算法做一个详细的介绍。选择CART做重点介绍的原因是scikit-learn 阅读全文
posted @ 2016-11-10 15:54 刘建平Pinard 阅读(134709) 评论(144) 推荐(48) 编辑
摘要: 在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。 阅读全文
posted @ 2016-11-09 22:03 刘建平Pinard 阅读(35139) 评论(11) 推荐(20) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 下一页