乐哈哈旅游视频网:
  2007年3月20日
摘要: A.问题背景 聚类是对数据对象进行划分的一种过程,与分类不同的是,它所划分的类是未知的,故此,这是一个“无指导的学习”(unsupervised learning)过程,即聚类算法不需要“教师”的指导,不需要提供训练数据,它倾向于数据的自然划分。 文本聚类(Text clustering): 将文本集合分组成多个类或簇,使得在同一个簇中的文本内容具有较高的相似度,而... 阅读全文
posted @ 2007-03-20 19:49 riky 阅读(3483) 评论(2) 推荐(0) 编辑
摘要: 基于文本的信息自动聚类的算法很多,我以前介绍过一些,比较流行的算法有我以前提到的KNN和SVM,在过去的一段时间里,空闲的时间基本上都用来研究能否快速的实现自动聚类。上周终于完成了文本自动聚类的兼并算法,能够相对快速的实现文本信息的自动聚类。下面就介绍一下信息自动聚类的实现,希望能够帮助大家了结google news 的新闻如何进行自动聚类工作。 1] 什么是简并算法简并算法是指在文本信息空间内寻... 阅读全文
posted @ 2007-03-20 19:48 riky 阅读(1520) 评论(0) 推荐(0) 编辑

乐哈哈旅游视频网: