摘要: 在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档 内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1<=k<=N。例 如一篇文档中有a、b、c、... 阅读全文
posted @ 2015-06-10 17:45 勿妄 阅读(246) 评论(0) 推荐(0) 编辑