10 2020 档案

AI大语音(十)——N-gram语言模型(深度解析)
摘要:扫描下方“AI大道理”,选择“关注”公众号 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。 阅读全文

posted @ 2020-10-14 16:21 AI大道理 阅读(1650) 评论(0) 推荐(0) 编辑

AI大语音(九)——基于GMM-HMM的连续语音识别系统
摘要:上一专题GMM-HMM声学模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。 本系统是单音素,未涉及后面三音子的训练以及决策树的内容。 在GMM专题和HMM专题中分别讲述了其训练都是EM算法,那么融合形成GMM-HMM模型后会如何训练?是应用 阅读全文

posted @ 2020-10-04 16:54 AI大道理 阅读(1499) 评论(2) 推荐(0) 编辑

导航