会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
jasonzhangxianrong
博客园
首页
新随笔
联系
订阅
管理
2021年5月24日
NLP(十八):训练字级别的word2vec、Fasttext和词级别的word2vec
摘要: 一、数据: word2vec训练数据格式说明:对于文本文件,基本格式是一行一句话,需要分好词。 (1)如果按字级别训练,将汉字分隔开就行。按字分割: line_str = line.replace(" ", "") cn = " ".join(line_str) (2)按词分割 方法有很多,jieb
阅读全文
posted @ 2021-05-24 10:17 jasonzhangxianrong
阅读(315)
评论(0)
推荐(0)
编辑
公告