Fork me on GitHub
摘要: (1)词集模型(Set Of Words): 单词构成的集合,集合自然每个元素都只有一个,也即词集中的每个单词都只有一个。 (2)词袋模型(Bag Of Words): 如果一个单词在文档中出现不止一次,并统计其出现的次数(频数)。 为文档生成对应的词集模型和词袋模型 考虑如下的文档: list o 阅读全文
posted @ 2018-06-27 13:56 郭耀华 阅读(4682) 评论(0) 推荐(1) 编辑