会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
LIDANDAN*
2018年6月7日
获得文本语料和词汇资源
摘要: 语料库的访问方法: raw( ) 没有经过任何语言学处理之前把文件内容分析出来 words( ) 把文本处理成一个个单词 sents( ) 把文本划分成语句,其中每一个句子都是一个词汇链表 注意: 数值比较: == 单词比较: = 条件频率分布 条件频率分布是一个对许多NLP都有用的数据结构。 频率
阅读全文
posted @ 2018-06-07 22:18 LIDANDAN*
阅读(130)
评论(0)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理
公告