信息检索导论学习笔记(8)-向量空间模型
摘要:
向量空间模型 在有了tf-idf权重计算之后,一个自然的数学建模的想法是:tf-idf权重矩阵 向量空间模型 把文档看成是一个向量(vector),其中的每个分量都对应词典中的一个词项,分量值为采用tf-idf计算出的权重值。当某词项在文档中没有出现时,其对应的分量值为0。 于是,我们有一个|V|维实值空间,空间的每一维都对应词项(V为词项数目)。 对于Web搜索引擎,空间可能会上千... 阅读全文
posted @ 2012-08-23 11:09 God bless you 阅读(4160) 评论(0) 推荐(0) 编辑