摘要: 论文名称:张雪松,贾彩燕.一种基于频繁词集表示的新文本聚类方法. 研究对象 中文语料库和英文语料库 研究动机 一种基于语义距离的文档特征提取方法。首先利用基于语义距离的方法提取主题相关词,然后利用信息增益算法从主题相关词中提取出文档特征。该方法首先利用语义距离准确缩小特征范围,之后再利用信息增益算法 阅读全文
posted @ 2019-07-30 15:37 悟空``` 阅读(171) 评论(0) 推荐(0) 编辑