摘要: 法一:Bag-of-words 词袋模型 文本特征提取有两个非常重要的模型: 词集模型:单词构成的集合,集合中每个元素都只有一个,也即词集中的每个单词都只有一个 词袋模型:如果一个单词在文档中出现不止一次,并统计其出现的次数(频数) 两者本质上的区别,词袋是在词集的基础上增加了频率的纬度,词集只关注 阅读全文
posted @ 2018-12-19 14:41 学海无涯苦作舟_书山有路勤为径 阅读(1603) 评论(0) 推荐(0) 编辑