摘要: 什么是语料库?文本语料库是一个大型结构化文本的集合。NLTK包含了许多语料库:(1)古滕堡语料库 (2)网络和聊天文本(3)布朗语料库(4)路透社语料库(5)就职演讲语料库(6)标注文本语料库 词汇列表语料库(1)词汇列表:nltk.corpus.words.wor... 阅读全文
posted @ 2018-07-19 21:56 yucen 阅读(1674) 评论(0) 推荐(0) 编辑
摘要: WordNet是一种面向语义的英语词典,由Princeton大学的心理学家、语言学家和计算机工程师联合设计。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。NLTK库中包含了英语WordNet,里面共有155287个词以及117659个同义词集... 阅读全文
posted @ 2018-07-19 21:34 yucen 阅读(838) 评论(0) 推荐(0) 编辑