聚类算法的评估应面向具体问题

现在要对所有的人进行分类, 如何进行?
通常的套路是:

  • 按照性别来分, 可以分为男人/女人/others.
  • 按照肤色来分, 可以分为白种人/黄种人/黑种人/...
  • 按照国籍来分, 可以分为中国人/美国人...
  • 按照...

显然, 按照不同的分类标准有不同的分类结果. 所以对聚类算法来说, 是没有什么gold-standard的普适评判标准的. 只有在给定了具体情景, 例如聚类是为了完成什么任务, 之后才好判断一个聚类算法是好是坏.

posted @ 2017-01-13 15:38  宁静是一种习惯  阅读(386)  评论(0编辑  收藏  举报