上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 39 下一页

2020年12月3日

OfficialKaldi(三)| 安装和运行Kaldi所需软件(翻译注解)

摘要: 理想的计算环境 首先,我们将说明理想的计算环境类型,然后说明运行Kaldi所需的最低要求。理想的计算环境是运行Sun GridEngine(SGE)的Linux计算机集群(任何主要发行版),并且可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下,网格上的某些计算机将具有NVidia G 阅读全文

posted @ 2020-12-03 09:14 AI大道理 阅读(338) 评论(0) 推荐(0) 编辑

2020年12月2日

OfficialKaldi(二)| 下载并安装Kaldi(翻译注解)

摘要: 现在,我们已过渡到GitHub以进行所有未来开发。您首先需要安装Git。可以通过在shell中键入以下内容来下载Kaldi的最新版本,其中可能包括未完成的和实验性的功能: git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin 阅读全文

posted @ 2020-12-02 23:57 AI大道理 阅读(179) 评论(0) 推荐(0) 编辑

OfficialKaldi(一)| 关于Kaldi项目(翻译注解)

摘要: 什么是卡尔迪? Kaldi是使用C ++编写的语音识别工具包,并根据Apache License v2.0获得许可。Kaldi供语音识别研究人员使用。有关更详细的历史记录和贡献者列表,请参见Kaldi项目的历史记录。 卡尔迪(Kaldi)这个名字 根据传说,卡尔迪是埃塞俄比亚的牧羊人,发现了咖啡植物 阅读全文

posted @ 2020-12-02 23:43 AI大道理 阅读(301) 评论(0) 推荐(0) 编辑

2020年11月26日

AI大语音(十四)——区分性训练 (深度解析)

摘要: 本文来自公众号“AI大道理” 声学模型的训练一般是基于极大似然准则(ML),然而ML只考虑正确路径的优化训练,没有考虑降低其他路径的分数,因此识别效果不佳。区分性训练目标是提高正确路径得分的同时降低其他路径的得分,加大这些路径间的差异,因此识别效果更好。 1 互信息 区分性训练的其中一个常用准则叫M 阅读全文

posted @ 2020-11-26 14:51 AI大道理 阅读(761) 评论(0) 推荐(0) 编辑

2020年11月23日

AI大语音(十三)——DNN-HMM (深度解析)

摘要: 本文来自公众号“AI大道理” GMM-HMM建模能力有限,无法准确的表征语音内部复杂的结构,所以识别率低。 随着深度学习的崛起,研究人员将其逐步应用于语音识别中。 最开始便是DNN代替了GMM来进行观察状态概率的输出,实现DNN-HMM声学模型框架,大大提高了识别率。 1 GMM-HMM与DNN-H 阅读全文

posted @ 2020-11-23 22:39 AI大道理 阅读(1300) 评论(0) 推荐(0) 编辑

2020年11月19日

AI大语音(十二)——WFST解码器(下)(深度解析)

摘要: 本文来自公众号“AI大道理”。 把HMM、语言模型N-gram、发音词典、上下文相关转化成WFST,再进行合成得到一个巨大的WFST。对这个巨大的WFST进行确定化、权重移动、最小化等优化,得到一个浓缩的包含各种约束的网络。语音识别就变成在一个WFST的搜索问题了,使用Viterbi的集束搜索得到最 阅读全文

posted @ 2020-11-19 23:14 AI大道理 阅读(918) 评论(0) 推荐(0) 编辑

2020年11月17日

AI大语音(十一)——WFST解码器(上)(深度解析)

摘要: 点击上方“AI大道理”,选择“置顶”公众号 为了让识别出来的语音符合常规语言表达,引入了语言模型作为约束。 为了加速解码识别效率又引入了WFST解码机制。 解码本质:解码就是在网络中寻找最优路径。 ​解码方式多种多样,各有优缺点。 ​ (注:on-the-fly Rescoring 归为动态解码有待 阅读全文

posted @ 2020-11-17 23:35 AI大道理 阅读(1095) 评论(0) 推荐(0) 编辑

2020年10月14日

AI大语音(十)——N-gram语言模型(深度解析)

摘要: 扫描下方“AI大道理”,选择“关注”公众号 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。 阅读全文

posted @ 2020-10-14 16:21 AI大道理 阅读(1565) 评论(0) 推荐(0) 编辑

2020年10月4日

AI大语音(九)——基于GMM-HMM的连续语音识别系统

摘要: 上一专题GMM-HMM声学模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。 本系统是单音素,未涉及后面三音子的训练以及决策树的内容。 在GMM专题和HMM专题中分别讲述了其训练都是EM算法,那么融合形成GMM-HMM模型后会如何训练?是应用 阅读全文

posted @ 2020-10-04 16:54 AI大道理 阅读(1452) 评论(2) 推荐(0) 编辑

2020年9月24日

AI大语音(八)——GMM-HMM声学模型

摘要: 基于GMM的0-9孤立词识别系统以词为训练单位,添加新词汇需要重新进行训练,若要涵盖所以词,差不多6万个词,训练量极大,预测时也要计算6万个模型的似然,哪个大预测出哪个,在实际应用中有局限性,只能应用于小词汇量场合。 孤立词识别系统识别了0-9的数字的英文单词,但是假如有人用英文报电话号码,是识别不 阅读全文

posted @ 2020-09-24 14:36 AI大道理 阅读(1589) 评论(0) 推荐(0) 编辑

上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 39 下一页

导航