摘要: 算法杂货铺——k均值聚类(K-means) 4.1、摘要 在前面的文章中,介绍了三种常见的分类算法。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的 阅读全文
posted @ 2019-01-17 15:33 DaLinY 阅读(634) 评论(0) 推荐(0) 编辑
摘要: 算法杂货铺——分类算法之贝叶斯网络(Bayesian networks) 2.1、摘要 在上一篇文章中我们讨论了朴素贝叶斯分类。朴素贝叶斯分类有一个限制条件,就是特征属性必须有条件独立或基本独立(实际上在现实应用中几乎不可能做到完全独立)。当这个条件成立时,朴素贝叶斯分类法的准确率是最高的,但不幸的 阅读全文
posted @ 2019-01-17 15:31 DaLinY 阅读(3426) 评论(0) 推荐(0) 编辑
摘要: 算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification) 0、写在前面的话 我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中,并解决了实际问题后,那种快感更是我在其它地方体会不到的。 一 阅读全文
posted @ 2019-01-17 15:29 DaLinY 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 算法杂货铺——分类算法之决策树(Decision tree) 3.1、摘要 在前面两篇文章中,分别介绍和讨论了朴素贝叶斯分类与贝叶斯网络两种分类算法。这两种算法都以贝叶斯定理为基础,可以对分类及决策问题进行概率推断。在这一篇文章中,将讨论另一种被广泛使用的分类算法——决策树(decision tre 阅读全文
posted @ 2019-01-17 15:15 DaLinY 阅读(757) 评论(0) 推荐(0) 编辑
摘要: KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法。 一句话总结:近朱者赤近墨者黑! k 近邻算法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k 近邻算法假设给定一个训练数据集,其 阅读全文
posted @ 2019-01-17 08:23 DaLinY 阅读(736) 评论(0) 推荐(0) 编辑