计算文本相似度方法总结(二)
总览
1.基于语料库
(1)词袋模型
VSM
LSA
PLSA
LDA
(2)神经网络
(3)搜索引擎
2.基于字符串
(1)基于字符
(2)基于词语
3.基于世界知识
(1)基于本体
(2)基于网络知识
4.其他方法
(1)句法分析
(2)混合方式
参考文献:
【1】文本相似度计算方法研究综述 Review of Studies on Text Similarity Measures
参考文献:
【1】文本相似度计算方法研究综述 Review of Studies on Text Similarity Measures