摘要: 主要内容:1、动机2、聚类3、python实现一、动机之前我们实现的分类器都是基于带标签或类别的数据集,这种学习方法叫做有监督的学习,这些数据一般都是通过人工标注的,成本和代价比较高。而实际中的原生数据都是没有标注的,如果没有标签,是否也能为这些数据进行分类呢?答案是肯定的,那就是本文要介绍的无监督... 阅读全文
posted @ 2015-10-06 20:32 AndyJee 阅读(1094) 评论(0) 推荐(0) 编辑
摘要: 主要内容:1、动机2、基于朴素贝叶斯的文本分类器3、python实现一、动机之前介绍的朴素贝叶斯分类器所使用的都是结构化的数据集,即每行代表一个样本,每列代表一个特征属性。但在实际中,尤其是网页中,爬虫所采集到的数据都是非结构化的,如新闻、微博、帖子等,如果要对对这一类数据进行分类,应该怎么办呢?例... 阅读全文
posted @ 2015-10-06 16:18 AndyJee 阅读(1174) 评论(0) 推荐(0) 编辑