摘要: 从音频文件中读取出来的原始语音信号通常称为raw waveform,是一个一维数组,长度是由音频长度和采样率决定,比如采样率Fs为16KHz,表示一秒钟内采样16000个点,这个时候如果音频长度是10秒,那么raw waveform中就有160000个值,值的大小通常表示的是振幅。 提取的特征最终以 阅读全文
posted @ 2022-06-27 22:43 Uriel-w 阅读(686) 评论(0) 推荐(0) 编辑