随笔分类 - 音频信号处理
摘要:实时语音通信发展到今天,用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异,声音问题依然存在。传统的音频处理技术从声音信号本身出发,挖掘其时频特性,作出假设,建立物理模型,很多参数都需要人工进行精细化微调,比较费时费力。随着AI技术的发展,凭借着其强大的拟合能力,利用数据
阅读全文
摘要:噪声问题一直是语音识别的一个老大难的问题,在理想的实验室的环境下,识别效果已经非常好了,之前听很多音频算法工程师抱怨,在给识别做降噪时,经常发现WER不降反升,降低了识别率,有点莫名其妙,又无处下手。 刚好,前段时间调到了AIlab部门,有机会接触这块,改善语音识别的噪声问题,虽然在此之前,询问过同
阅读全文
摘要:针对传统经典的线性混音,路数多时音量变小的缺点;自创了一个新的混音算法,解决该问题,声音不会忽大忽小,而且该方法还能一定程度抑制噪声,突出人声,能实时计算量小,专利已经受理。 对于混音方法,网上和文献上流传许多方法。 1.平均权重 2.随幅值变化的权重3.利用衰减因子缓慢规整4.绝对值处理5.A+B
阅读全文
摘要:Maybe you were asking if there is some kind of design tool allowing to convert an IIR filter into an FIR filter automatically. There is no such a prog
阅读全文
摘要:音质优化,回声消除试听:https://pan.baidu.com/s/1nvObNvz 时域: LMS滤波器 参数更新公式: 权重更新收到输入信号的能量影响较大,输入信号能量越大,步长取值应该较小,保证不容易发散。 步长太大,容易发散。 步长太小,稳定,但是收敛速度慢,相互矛盾。 缺点: 1.逐个
阅读全文
摘要:在实际当中,回授音有很多种。我们最常听到的“啸叫”也是一种。但我们要寻找的是那种可以控制音量,时间,音高,甚至音色的回授。“啸叫”是不可控制的。从不可控制的啸叫到可控制的回授,这是一个漫长的历程。 常见生活中的例子:拿着话筒K歌或者讲话时,离音箱太近会产生刺耳的声音,这就是啸叫。 产生原因 简单来说
阅读全文
摘要:该结果的STFT显示效果,参数不同,显示的结果也不同。 此处只演示线性关系的效果。 clc;clear;fs = 16000;t = 0:2*fs;phase = 2*pi*(0.05*t+1000)/fs.*t;x = sin(phase);spectrogram(x,256,250,256,fs
阅读全文
摘要:QMF滤波器组 经常被用来子带信号分解,降低信号带宽,使各个子带可顺利由通道处理。 2^M个通道,等宽 QMF 正交镜像滤波器 正交滤波器 A(W) 与 A(W+pi) 之间的关系 H(z) 与 H(-z) , H(e(jw)) H(e(jw+pi)) 镜像,对称,平移 镜像,时域关系: 下采样与原
阅读全文
摘要:%wavlet break detection%清除以前的数据clear;close all;%载入原始信号的波形数据load freqbrk;%幅度明显跳变,第一类跳变点%显示数据的基本信号whos;figure;plot(freqbrk);%自定义坐标轴xlabel('时间'); ylabel(
阅读全文