目录: 一基本训练 二语言模型打分 三语言模型剪枝 四语言模型合并 五语言模型使用词典限制 一、基本训练 有两种训练方法,分别如下: 二、语言模型打分 例: 三、语言模型剪枝 例: 四、语言模型合并 在合并语言模型之前,可以使用脚本计算出最好的比例,参考srilm的compute-best-mix脚 Read More
posted @ 2017-08-29 21:24 dahu1 Views(4786) Comments(1) Diggs(1) Edit
先看一下语言模型的输出格式 ARPA是常用的语言模型存储格式, 由主要由两部分构成。模型文件头和模型文件体构成。 上面是一个语言模型的一部分,三元语言模型的综合格式如下: 第一项表示ngram的条件概率,就是P(wordN | word1,word2,。。。,wordN-1)。 第二项表示ngram Read More
posted @ 2017-08-29 17:02 dahu1 Views(3608) Comments(0) Diggs(2) Edit