04 2021 档案
摘要:https://mp.weixin.qq.com/s/q8iBh2OO-Qz1wT7J1Uix7A
阅读全文
摘要:Fbank是一种前端处理方法,以类似人耳的方式对音频进行处理,可以提高语音识别的性能。fbank的计算流程与语谱图类似,唯一的区别就在于加了个Mel滤波器,从而使得得到的特征更逼近人耳特性。有关于Mel滤波器的相关内容可以查阅https://mp.weixin.qq.com/s/pGwO_27x8d
阅读全文
摘要:https://mp.weixin.qq.com/s/pGwO_27x8ddQF55wTSQlmA
阅读全文
摘要:https://mp.weixin.qq.com/s/PKBZgFXicNHghb39iyPfow
阅读全文
摘要:欲知更多,请关注公众号:音频探险记 LPC 线性预测系数的基本思想:由于语音样点之间存在着相关性,那么当前点/未来点可以用过去的p个样本点进行预测,即 其中就是要求的LPC,P表示预测阶数。 好处:可以得到声道模型及其模型参数的方法,广泛用于语音识别以及语音合成中。 import librosa i
阅读全文
摘要:具体内容可参考 https://mp.weixin.qq.com/s/h0cqr0_fcE8OQqXutAQS7g
阅读全文
摘要:具体内容可以参考 https://mp.weixin.qq.com/s/sxufihY0vXNvYoHOSeJteA
阅读全文