摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第二章 获取文本预料和词汇资源 2.4 词典资源词汇列表语料库发音的词典比较词表词汇工具: Toolbox和Shoebox 2.4 词典资源 词汇列表语料库 1def unusual_words(text):  阅读全文
posted @ 2018-12-07 14:50 ly803744 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第二章 获取文本预料和词汇资源 2.3 更多关于python:代码重用函数及函数的调用 2.3 更多关于python:代码重用 函数及函数的调用 1def plural(word):    阅读全文
posted @ 2018-12-07 14:49 ly803744 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第二章 获取文本预料和词汇资源 2.2 条件频率分布条件和事件按文体计数词汇绘制分布图和分布表使用双连词生成随机文本 2.2 条件频率分布 条件和事件 1text = ['The','Fulton','Cou 阅读全文
posted @ 2018-12-07 14:48 ly803744 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第二章 获取文本预料和词汇资源 2.1 获取文本语料库古腾堡语料库网络和聊天文本布朗语料库路透社语料库就职演说语料库标注文本语料库其他文本语料库文本语料库结构 2.1 获取文本语料库 一个文本语料库是一大段文本,许多语料库的设计 阅读全文
posted @ 2018-12-07 14:45 ly803744 阅读(3367) 评论(0) 推荐(0) 编辑
摘要: 微信公众号:数据运营人本系列为博主的读书学习笔记,如需转载请注明出处。 第一章 语言处理与python 1.5 自动理解自然语言词意消歧指代消解自动生成语言机器翻译人机对话系统文本的含义 1.5 自动理解自然语言 词意消歧 大家都应该知道,无论是汉语,英语甚至其他语言,每一个词语都有不同的含义,所谓 阅读全文
posted @ 2018-12-07 14:44 ly803744 阅读(1257) 评论(0) 推荐(0) 编辑