06 2013 档案
摘要:习题 6-19:(信息检索导论) 计算查询digital cameras及文档digital cameras and video cameras的向量空间相似度并 将结果填入表6-1的空列中。假定N=10 000 000(总文档个数=N),对查询及文档中的词项权重(wf对应的列) 采用对数方法计算,查询的权重计算采用idf,而文档归一化采用余弦相似度计算。将 and 看成 是停用词。请在tf列中给出词项的出现频率,并计算出最后的相似度结果。 表6-1 习题6-19中的余弦相似度计算 又题目可知:查询q:digital cameras 某文档:digit...
阅读全文