会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
知亦行
博客园
首页
新随笔
联系
订阅
管理
随笔 - 40
文章 - 0
评论 - 17
阅读 -
21万
2021年1月18日
文本表示
摘要: 将文本数据表示成计算机能够运算的数字或向量 离散表示 独热编码(One-hot) 思想: 将语料库中所有的词拉成一个向量,给每个词一个下标,就得到对应的词典。每个分词的文本表示为该分词的比特位为1,其余位为0的矩阵表示。 词袋模型(Bag of Words) 思想: 把每篇文章看成一袋子词,并忽略每
阅读全文
posted @ 2021-01-18 23:41 知亦行
阅读(645)
评论(0)
推荐(0)
编辑
公告
Live2D
欢迎阅读
『2021 年 1月 18 日 随笔档案』
换人
变装
移除
昵称:
知亦行
园龄:
6年1个月
粉丝:
33
关注:
4
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
初学者
(9)
必备
(6)
Android
(3)
Python
(2)
LINUX
(2)
Java
(2)
简单实例
(2)
常用指令
(2)
Windows
(1)
NLP
(1)
更多
随笔分类
Android(5)
C/C++(4)
java体系(2)
linux初学(2)
MySQL(2)
python(7)
工具站(3)
机器学习(1)
前端学习(2)
数据结构(4)
数据挖掘导论-实验作业(7)
知识工程(1)
自然语言处理(1)
阅读排行榜
1. 时间复杂度怎么算?如何计算时间复杂度?时间复杂度(70822)
2. 空间复杂度怎么算?如何计算空间复杂度?(30368)
3. thymeleaf th:href url传递多参数(15642)
4. MySQL向数据库表的某字段追加数据(14248)
5. c++ vector去除重复元素(11543)
推荐排行榜
1. 时间复杂度怎么算?如何计算时间复杂度?时间复杂度(36)
2. 空间复杂度怎么算?如何计算空间复杂度?(8)
3. 如何判断某种结构是逻辑结构还是存储结构或数据结构?(4)
4. thymeleaf th:href url传递多参数(4)
5. DIV+CSS初学随记(3)
点击右上角即可分享