分类Classification & 聚类Clustering

  1. 分类和聚类的区别

  Classification(分类),根据文本的特征或属性,划分到已有的类别中。即分类器classifier已被告知有哪些类别。分类器通过对已知分类的数据进行学习,找到这些不同类的特征,再对未分类的数据进行分类。这种提供训练数据的过程属于监督学习supervised learning。

  Clustering(聚类),聚类问题不清楚数据有几个分类,只是把相似的数据分到一组。因此一个聚类算法通常只需要知道如何计算相似度即可,不需要使用训练数据进行学习,是无监督学习unsupervised learning。

2. 待续

 

 

posted on 2017-10-09 23:33  奥卡姆的剃刀  阅读(873)  评论(0编辑  收藏  举报

导航