会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Timcode
博客园
首页
新随笔
联系
订阅
管理
2019年7月28日
机器学习-文本处理
摘要: 基础知识 语料库(corpus):语料库有三点特征语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;语料库是承载语言知识的基础资源,但并不等于语言知识;真实语料需要经过加工(分析和处理),才能成为有用的资源。 北京大学语料库(http://icl.pku.edu.
阅读全文
posted @ 2019-07-28 21:22 Timcode
阅读(3727)
评论(0)
推荐(1)
编辑
公告