会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
蛙蛙池塘
人生价值的最好体现就是做好本职工作...
CnBlogs
Home
New Post
Contact
Admin
Subscription
2008年5月10日
蛙蛙推荐:蛙蛙教你文本聚类
摘要:文本聚类是搜索引擎和语义web的基本技术,这次本蛙和大家一起学习一下简单的文本聚类算法,可能不能直接用于实际应用中,但对于想学搜索技术的初学者还是有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。关于这些概念可以去google,或者参考文本后的参考链接。
Read More
posted @ 2008-05-10 20:43 蛙蛙王子
Views(23695)
Comments(51)
Diggs(6)
Edit
公告