会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
专注 .NET
专注 .NET
博客园
首页
新随笔
联系
管理
订阅
2009年4月9日
文本相似度的计算-向量空间模型
摘要: (转) 在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1<=k<=N。例如一篇文档中有a、b、c、d四个特征项,那么这篇文档就可以表示为D(a,b,c,d)。对含有n个特征项的文本而言,通常...
阅读全文
posted @ 2009-04-09 16:33 H.Q.L
阅读(8899)
评论(0)
推荐(2)
编辑
公告