摘要:
这里隆重推出介绍一种词义消歧的(简单)方法:句子相似度虽然第一反应一定是介个,但是总不能说他们的相似度就是单词出现的重复次数吧= =||,怎么看都觉得不科学233于是,我们想到了最简单却又好用的相似度判断方式,就是"余弦相似性"(cosine similiarity)了啦:我们现在有两句话s1和s2... 阅读全文
摘要:
首先引用百度百科的话:"TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。""TF-IDF实际上是:TF * IDF,TF词频(Term Frequency),... 阅读全文
摘要:
RT,学校课题需要233,没了话说,窝直接做个链接的集合好了,方便以后查找特征值提取之 -- TF-IDF值的简单介绍汉语语义消歧之 -- 句子相似度汉语语义消歧之 -- 词义消歧简介c++读入之 -- 汉字读入遇到的问题c++实现之 -- 汉语词语的简单处理c++实现之 -- 文章TF-IDF值的... 阅读全文