采样频率:  44.1kHz ,它的意思是每秒取样44100次   。8kHz    8000次,  16kHz   160000次

比特率:  比特率是大家常听说的一个名词,数码录音一般使用16比特、20比特或24比特制作音乐。什么是“比特”?我们知道声音有轻有响,影响声音响度的物理要素是振幅,作为数码录音,必须也要能精确表示乐曲的轻响,所以一定要对波形的振幅有一个精确的描述。“比特(bit)”就是这样一个单位,16比特就是指把波形的振幅划为2^16即65536个等级,根据模拟信号的轻响把它划分到某个等级中去,就可以用数字来表示了。和采样频率一样,比特率越高,越能细致地反映乐曲的轻响变化。20比特就可以产生1048576个等级,表现交响乐这类动态十分大的音乐已经没有什么问题了。刚才提到了一个名词“动态”,它其实指的是一首乐曲最响和最轻的对比能达到多少,我们也常说“动态范围”,单位是dB,而动态范围和我们录音时采用的比特率是紧密结合在一起的,如果我们使用了一个很低的比特率,那么就只有很少的等级可以用来描述音响的强弱,当然就不能听到大幅度的强弱对比了。动态范围和比特率的关系是;比特率每增加1比特,动态范围就增加6dB。所以假如我们使用1比特录音,那么我们的动态范围就只有6dB,这样的音乐是不可能听的。16比特时,动态范围是96dB。这可以满足一般的需求了。20比特时,动态范围是120dB,对比再强烈的交响乐都可以应付自如了,表现音乐的强弱是绰绰有余了。发烧级的录音师还使用24比特,但是和采样精度一样,它不会比20比特有很明显的变化,理论上24比特可以做到144 dB的动态范围,但实际上是很难达到的,因为任何设备都不可避免会产生噪音,至少在现阶段24比特很难达到其预期效果。

 

假设音频采样率 = 8000,采样声道 = 2,位深度 = 16,采样间隔(毫秒) = 20ms或30ms或...    数据量是1000ms(1秒)/20ms = 50    (20ms)

size = 8000 x 2 x 16bit x 0.02s = 5120bit / 8bit = 640 byte

(1byte == 8bit ,1字节==8位)bit就是位,也叫比特位,是计算机表示数据最小的单位

 byte就是字节

1byte=8bit

1byte就是1B

一个字符=2字节

1KB=1024B

首先我们计算一秒钟总的数据量,采样间隔采用20ms的话,说明每秒钟需采集50次,这个计算大家应该都懂,那么总的数据量计算为

一秒钟总的数据量 =8000 * 2*16/8 = 32000

所以每帧音频数据大小 = 32000/50 = 640

每个声道采样样本数 = 640/2 = 320

 

https://blog.csdn.net/KevinDGK/article/details/52934221  speex和Opus 压缩库介绍

http://blog.csdn.net/wzy198852/article/details/48178703   AudioProcessing降噪处理过程

http://blog.csdn.net/chinabinlang/article/details/41867189 NS(Noise Suppression 噪声抑制)、VAD(Voice Activity Detection 静音检测)、AECM(Acoustic Echo Canceller for Mobile 声学回声消除)以及 AGC(Auto Gain Control 自动增益控制)

http://www.cnblogs.com/mod109/p/5469799.html

http://www.jianshu.com/p/77a363960711

http://blog.csdn.net/qazwsxwtc?viewmode=contents

https://chromium.googlesource.com/external/webrtc/+/master/webrtc/modules/   webrtc源码

 http://blog.csdn.net/KevinDGK/article/details/52934221#二局域网语音配置   一些参考