ML_Clustering & Retrieval(一)

检索是什么,有什么用?

  检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程,在信息冗余的时代,高效的检索显得越发重要。

 

  

比如说我们如何从众多图片中找到和自家小狗相似的小狗的图片

  如何从众多产品中找到我们想要购买的按摩椅

  如何从众多电影/歌曲/电视节目中找到我们喜欢的

  如何从新闻报纸等众多文章中找到我们感兴趣的

  如何从社交网络的众人中找到我们想要认识的(find like-minded users)

  等等。。

聚类是什么,有什么用?

  与分类不同,聚类不需要先验知识,仅根据现有数据的特征空间,将相似节点聚为一类,最终达到类别内节点相似,类别间节点相异。是一种无监督学习。

 

 聚类既能作为一个单独过程,用于找寻数据内在的分布结构,也可以作为分类等其他学习任务的前驱过程。

posted @ 2016-07-30 15:51  python挖掘  阅读(186)  评论(0编辑  收藏  举报