webrtc开源项目音频重采样“不友好接口”的几点总结
WebRTC(Web Real Time Communication)并不是Google原来自己的技术,在2010年,Google以大约6820万美元收购了VoIP软件
开发商Global IP Solutions公司,开源了WebRTC实时通信项目。
语音引擎是GIPS的语音通信的杀手锏,其主要是通过一系列的传输控制来达到在低带宽下传输实时的语音,GIPS语音引擎有着
广泛的客户群,比如skype、QQ等语音都是采用GIPS的语言引擎。通过其语音引擎,不仅能传输质量更高的语音,还能在丢包非常
严重的网络下传输实时的语音。
音频部分涉及:音频编解码、声音加密、声音处理、回声消除(AEC)、AECM、自动增益(AGC)、降噪处理。今天试用了 一下声
音处理部分的CResampler类,用得不是很爽。
1.仅限于单声道和双声道的处理,对于多声道音频,需要自己前期做些预处理。
kResamplerSynchronous = 0x10, kResamplerSynchronousStereo = 0x20
2.同样地:仅限于16bits的数据处理,需要自己添加8bits、32bits、浮点数处理。
int Push(const WebRtc_Word16* samplesIn, int lengthIn, WebRtc_Word16* samplesOut, int maxLen, int &outLen);
3.另外,为了实现快速重采样算法,每次处理samplesIn的长度有所限制。不同重采样因子下,对长度要求不一样。
例如: if ((lengthIn % 80) != 0) return -1; // We can only handle blocks of 80 samples, Can be fixed, but I don't think it's needed
其次,每次处理的最大长度不能超过SHRTMAX。
4. 对于44.1kHz和22.1kHz,都做了简化处理,当做44kHz和22kHz,减小处理每次处理数据量,加快运算速度,但是同时也
丢失了部分数据,降低了数据精度。
5.最后对分数级的重采样都分为几个步骤处理,减小每次处理的数据量,加快运算速率,简化代码量,对音频音质不会产生影响。
总体上来说,这套重采样代码实现了重采样的基本功能,主要优势体现在速度上,同时依赖的库和文件比较少。
6.不支持48k转44.1kHz