文章分类 -  语音识别

摘要:听觉感知 口语速率最高达每秒12个因素。人类能理解的口语速度最多不能超过每分钟50-60个语音。言语知觉存在2个困难问题:一是线性问题。正常口语中,音素会出现重叠现象,同时存在一种协同发音现象,即一个语音片段的产生会影响到后一个片段的产生。二是非恒定性问题。任何给定语音成分的声音模式并不是恒定不变的 阅读全文
posted @ 2022-12-17 18:00 koala999 阅读(353) 评论(0) 推荐(0) 编辑
摘要:主要的坑有两个 第一,要解决git bash环境下python脚本输出重定向问题,网上有的说可用winpty解决,但我没成功,我采用笨办法,在cmd环境下手动运行py脚本输出结果。 第二,要解决kaldi script使用ark:-标准输入输出问题,我采用的是临时文件方式解决。 最耗内存的是fstd 阅读全文
posted @ 2022-03-04 08:25 koala999 阅读(140) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示