会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ICDTAD
博客园
首页
新随笔
联系
订阅
管理
2021年5月27日
TF-IDF学习
摘要: 文本特征提取 1.切开文本中的每个词,我们把这个叫分词 2.每一个文本都用一组词对应的数值来表示它,这就变成结构化数据了。每个词对应的数值就是该词在文本中出现的次数。 3.上述的这种对文本的特征表示方法就称为“词袋”模型, 词袋的英文是Bag of Words,所以有时候又把词袋叫 BOW 不是每一
阅读全文
posted @ 2021-05-27 17:48 ICDTAD
阅读(39)
评论(0)
推荐(0)
编辑
公告