摘要: 引自:http://hi.baidu.com/zzpppork/blog/item/c1c79cfadbfe0a6e034f5683.html 在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1<... 阅读全文
posted @ 2011-11-17 17:11 张保维 阅读(322) 评论(0) 推荐(0) 编辑