2018年6月7日

摘要: 语料库的访问方法: raw( ) 没有经过任何语言学处理之前把文件内容分析出来 words( ) 把文本处理成一个个单词 sents( ) 把文本划分成语句,其中每一个句子都是一个词汇链表 注意: 数值比较: == 单词比较: = 条件频率分布 条件频率分布是一个对许多NLP都有用的数据结构。 频率 阅读全文
posted @ 2018-06-07 22:18 LIDANDAN* 阅读(130) 评论(0) 推荐(0) 编辑

导航