摘要: 1、文本类的分类任务,特征提取几种方式 1、词集模型 文本中单词的种类的集合,只统计单词的有无,和出现个数无关 使用场景:自定义的词集黑名单,是否可以使用这种模型,具体使用方式(TODO1)? 2、词袋模型 相对于词集模型,还有统计每个单词出现的次数(频率) 实现原理:参考sklearn(TODO2 阅读全文
posted @ 2019-11-09 19:37 哈哈哈喽喽喽 阅读(737) 评论(0) 推荐(0) 编辑