摘要:
具体内容可以参考 https://mp.weixin.qq.com/s/sxufihY0vXNvYoHOSeJteA 阅读全文
摘要:
本文档主要介绍开源框架webrtc中agc2原理,以下部分全是个人所理解的,如有错误之处请指出。agc2算法主要有3个模块,固定增益模块,自适应模块以及限幅模块。其关键函数位于GainController2.cc中的Process(AudioBuffer* audio) ...未完待续 本文的具体内 阅读全文
摘要:
DRC,全名Dynamic Range Control,主要用于调整输入语音的动态范围。应用场景可以有如下的几种形式 • 类似于AGC的功能,对输入的忽大忽小语音进行动态拉伸,使语音听起来平稳。 • 作为小信号滤除器,滤除低于某一阈值的信号。一般用来滤除噪声,避免噪声在后续模块AGC中被放大。 本文 阅读全文
摘要:
在这篇文章中,主要是对Python做一个较为细致的回顾。 Type Python中比较常用的几种数据类型包括string,integer以及float。一般通过type()去获得一个变量的数据类型 x = 2.14 type(x) # float x = 2 type(x) # int x = '2 阅读全文
摘要:
本文主要整理了webrtc中agc2模块。目前为止,webrtc提供的agc总共有三个版本,最老的版本在legacy文件夹下,然后就是agc文件下的一个版本,最后一个就是位于agc2文件下的另一版本。相较于之前的版本,agc2引入了RNN做vad估计。当然其它的部分也有所改进,如噪声估计、增益求解。 阅读全文
摘要:
最近在实现某个功能的时候,用到了np.random.choice这个函数。特此记录一下,以免日后忘记。它的功能就是从给定的一个1-D数组中以某种概率随机抽取D个数。函数的定义如下 choice(a, size=None, replace=True, p=None) a: 给定的一维数组且必须是一维数 阅读全文
摘要:
最近在给一个多通道语音加上不同信噪比的单通道噪声的时候,需要将单通道噪声变成多通道,比如$61$的噪声向量,那么需要变成$64$的矩阵。也就是将自身堆叠4次构成新的矩阵。然后再去跟多通道语音相加。(因为后面涉及到一些操作,广播的方式不利于后面的处理)。 现在介绍两种方法解决该问题 使用tile im 阅读全文
摘要:
最近在实现一个功能的时候,用到了webrtc模块的vad部分的python版本,因参考的原博客找不到链接了,为了方便自己以后查阅相关内容,故整理成博客供日后方便。接下来开始正题,当然了,要想使用这个webrtcvad,自然就是安装它了,命令也很简单。 pip install webrtcvad 关于 阅读全文
摘要:
pyroomacoustics能够在2D/3D房间中快速构建单/多个声源以及麦克风的模拟场景,借助image方法能够有效生成房间脉冲响应并模拟声源和麦克风之间的传播途径。接下来系列博文将主要介绍pyroomacoustics的使用。今天主要介绍利用pyroomacoustics生成房间脉冲相应(Ro 阅读全文
摘要:
在virtualbox中设置共享文件夹后,然后登陆ubuntu系统访问共享文件夹,发现没有权限。查看共享文件夹的属性可知,共享文件夹的所有者是`root`,所属的组是`vboxsf`。以用户登录的时候,自然是没法访问该文件夹的。 那么就需要将用户添加到组中,以获得访问权限。 sudo usermod 阅读全文