文章分类 - 语音识别
摘要:听觉感知 口语速率最高达每秒12个因素。人类能理解的口语速度最多不能超过每分钟50-60个语音。言语知觉存在2个困难问题:一是线性问题。正常口语中,音素会出现重叠现象,同时存在一种协同发音现象,即一个语音片段的产生会影响到后一个片段的产生。二是非恒定性问题。任何给定语音成分的声音模式并不是恒定不变的
阅读全文
摘要:主要的坑有两个 第一,要解决git bash环境下python脚本输出重定向问题,网上有的说可用winpty解决,但我没成功,我采用笨办法,在cmd环境下手动运行py脚本输出结果。 第二,要解决kaldi script使用ark:-标准输入输出问题,我采用的是临时文件方式解决。 最耗内存的是fstd
阅读全文