随笔档案「2017年8月29日」：语言模型srilm基本用法 ... - dahu1

2017年8月29日

目录: 一基本训练二语言模型打分三语言模型剪枝四语言模型合并五语言模型使用词典限制一、基本训练有两种训练方法，分别如下：二、语言模型打分例: 三、语言模型剪枝例: 四、语言模型合并在合并语言模型之前，可以使用脚本计算出最好的比例，参考srilm的compute-best-mix脚 Read More

posted @ 2017-08-29 21:24 dahu1 Views(4870) Comments(1) Diggs(1)

SRILM语言模型格式解读

先看一下语言模型的输出格式 ARPA是常用的语言模型存储格式, 由主要由两部分构成。模型文件头和模型文件体构成。上面是一个语言模型的一部分，三元语言模型的综合格式如下：第一项表示ngram的条件概率，就是P(wordN | word1，word2，。。。，wordN-1）。第二项表示ngram Read More

posted @ 2017-08-29 17:02 dahu1 Views(3774) Comments(0) Diggs(2)

dahu的菜园子

公告