摘要:
一个句子在语料库中出现的概率,该如何计算? 句子由单词构成,把句子表示成单词列表,则一个句子在一个语料库出现的概率为: 而利用极大似然估计可以计算每个后验概率: 随着句子长度的增大,语料库极有可能统计不到长句子的频次,导致=0 马尔科夫链:给定时间线上一串事件顺序发生,每个事件发生概率只取决于前一个 阅读全文
摘要:
生成器函数:参数为任意的可迭代对象,返回值是生成器。 def vowel(c): return c.lower() in 'aeiou' #使用filter函数生成符合条件的字符串列表 list(filter(vowel,'Aardvark')) #使用itertools的filterfalse函数 阅读全文