摘要: 一个句子在语料库中出现的概率,该如何计算? 句子由单词构成,把句子表示成单词列表,则一个句子在一个语料库出现的概率为: 而利用极大似然估计可以计算每个后验概率: 随着句子长度的增大,语料库极有可能统计不到长句子的频次,导致=0 马尔科夫链:给定时间线上一串事件顺序发生,每个事件发生概率只取决于前一个 阅读全文
posted @ 2020-08-23 17:03 猫七的blog 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 生成器函数:参数为任意的可迭代对象,返回值是生成器。 def vowel(c): return c.lower() in 'aeiou' #使用filter函数生成符合条件的字符串列表 list(filter(vowel,'Aardvark')) #使用itertools的filterfalse函数 阅读全文
posted @ 2020-08-23 13:17 猫七的blog 阅读(129) 评论(0) 推荐(0) 编辑