会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
程序员小应
博客园
首页
新随笔
联系
订阅
管理
2020年1月22日
Python自然语言处理 第2章获得文本语料和词汇资源 学习笔记
摘要: 2.1 获取文本语料库 古腾堡语料库 NLTK 包含古腾堡项目(Project Gutenberg)电子文本档案的经过挑选的一小部分文本,该项目大约有25,000本免费电子图书,放在http://www.gutenberg.org/上。 找出简.奥斯丁的《爱玛》,并给它一个简短的名称emma,然后找
阅读全文
posted @ 2020-01-22 16:05 程序员小应
阅读(222)
评论(0)
推荐(0)
编辑
公告