kenlm的使用

1.训练模型

install_path/bin/lmplz -o 3 -S 80% -T /temp <text >text.arpa

2.查询模型

为了更快的加载将 text.arpa 转换为 binary 文件

install_path/bin/build_binary text.arpa text.binary

测试

install_path/bin/query text.binary <test.txt >result.txt

结果如下图所示，输出每个句子的混淆度和未登录词，以及整个测试语料的混淆度和未登录词。

posted on 2018-08-22 17:24 蜗牛kuai快跑阅读(1869) 评论(0) 收藏举报

刷新页面返回顶部

蜗牛kuai快跑