2017年2月17日
摘要: 条件频率分布就是频率分布的集合,每个频率分布有一个不同的“条件”,这个条件通常是文本的类别。当语料文本分为几类(文体,主题,作者等)时,可以计算每个类别独立的频率分布,这样,就可以通过条件频率分布研究类别之间的系统性差异。通常,我们用nltk的ConditionalFreqDist数据类型来实现的。 阅读全文
posted @ 2017-02-17 16:24 寒若雪 阅读(2211) 评论(0) 推荐(0) 编辑