会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
郭耀华's Blog
欲穷千里目,更上一层楼
项目主页:
https://github.com/guoyaohua/
博客园
首页
新随笔
联系
订阅
管理
2018年6月27日
NLP基础——词集模型(SOW)和词袋模型(BOW)
摘要: (1)词集模型(Set Of Words): 单词构成的集合,集合自然每个元素都只有一个,也即词集中的每个单词都只有一个。 (2)词袋模型(Bag Of Words): 如果一个单词在文档中出现不止一次,并统计其出现的次数(频数)。 为文档生成对应的词集模型和词袋模型 考虑如下的文档: list o
阅读全文
posted @ 2018-06-27 13:56 郭耀华
阅读(4713)
评论(0)
推荐(1)
编辑
公告