摘要: 主要内容:1、动机2、贝叶斯定理3、朴素贝叶斯分类器4、NB与KNN比较5、python实现一、动机1、前面提到的最近邻、K近邻作为分类器来说,只是说新样本更大可能性地属于某一类,并不能准确地给出一个确信度;2、最近邻、K近邻分类器中,每次为新样本做分类都需要将所有训练样本全盘托出,计算一遍,这样的... 阅读全文
posted @ 2015-10-05 20:59 AndyJee 阅读(807) 评论(0) 推荐(0) 编辑
摘要: 主要内容:1、十折交叉验证2、混淆矩阵3、K近邻4、python实现一、十折交叉验证前面提到了数据集分为训练集和测试集,训练集用来训练模型,而测试集用来测试模型的好坏,那么单一的测试是否就能很好的衡量一个模型的性能呢?答案自然是否定的,单一的测试集具有偶然性和随机性。因此本文介绍一种衡量模型(比如分... 阅读全文
posted @ 2015-10-05 16:54 AndyJee 阅读(4886) 评论(1) 推荐(0) 编辑
摘要: 1、动机2、基于内容的分类器3、python实现一、动机在前面的文章中介绍了基于用户和基于物品的协同过滤推荐方法,其实无论是基于用户还是基于物品,都是通过群体效应来进行推荐,因为衡量相似度的向量都是基于一定群体用户的评分,所以推荐出来的物品都是热门的流行的物品,对于一些冷门物品可能就无法收到亲睐。而... 阅读全文
posted @ 2015-10-05 11:01 AndyJee 阅读(1969) 评论(0) 推荐(0) 编辑