Sigmoid非线性激活函数,FM调频,胆机,HDR的意义
前几天家里买了个二手车子,较老,发现只有FM收音机,但音响效果不错,车子带蓝牙转FM,可以手机蓝牙播放音乐,但经过几次转换以及对FM的质疑,所以怀疑音质是否会剧烈下降,抱着试试的态度放了一个手机上的音乐,结果感动的流泪了,为什么以前手机带的高保真耳机中遗失了那么多精彩内容,高保真音响,高保真功放.....为何不敌即将淘汰的车载的FM...
记得中学的时候经常看电子类书籍,对各种音响电路都很着迷,那是后流行高保真这一概念,各种信号补偿带通滤波反馈控制算法,就为了让声音能够真实的还原出来,特别鄙视那些玩胆机的人,认为他们不懂理论,只是固执与迷信,后来学习神经网络知道了人类神经元的Sigmoid激活函数,但不慎理解,认为这是人类感官系统的缺陷,工作在非线性的模式分类中将失去认识真实世界的能力。
由于FM带来的震撼,我不得不对以前学习过的人类神经元原理做出新的认识,神经元对信号强度做收集和分类,其分类的边界控制由激活函数来确定,Sigmoid激活函数由三部分工作区域组成。
第一部分是在正常信号输入的线性工作区,输入信号的强度与模式分类线性相关,意即我们人类可以准确识别出信号的物理强度,对信号的变化很敏感。
第二部分则是在较弱和较强的信号输入的非线性工作区,这个区间的信号在做模式分类时人类则不能准确识别信号的物理强度,10倍物理强度差别的信号对于我们来讲可能差别微乎其微,仅仅能识别出微弱的差别。
第三部分是超过神经元传感器工作阈值的截止区,这个区域无论信号强度如何变化,我们都将不能区别出其强度差别。
接下来看看FM做了什么,他为何将Mp3音乐中一些消失殆尽的场景再次还原出来,让我的耳朵变得年轻了。
上图是FM调频器件变容二极管的振幅频率特性曲线(没有找到直接的图片),这个图说明什么呢,他说明小功率信号可以获得更多的增益,而大功率信号则被抑制,结合人类感知Sigmoid激活函数来看,其意义就是工作在非线性工作区微弱的不能敏感体会到的细节音乐拉进可以敏感识别的Sigmoid线性工作区,同样将声音大不能体现其变化细节的音乐也拉近Sigmoid线性工作区,因此经过FM非线性调频后,我们将获得饱满的声场,这将不再是迷信。
同样具备非线性放大的功放的还有胆机,为什么很多是前胆后石,原因是胆做了非线性放大(失真变换),将声场变换到Sigmoid线性工作区,之后再交给石机做高保真(线性)的功率放大(胆机电流小,无法做功率推动)。
如果你对声音不敏感,那么你应该对HDR以及超级夜景图片敏感吧,HDR图片将高动态范围中感光较强的信号做抑制(降低曝光度),将暗光信号微弱的信号做加强曝光,然后将两种信号混合得到人眼能够观察到细节的强度范围上来。
因此FM 胆机相当于音频领域的HDR,由于神经元的Sigmoid激活特性,实际上保真对于人类感官来讲意义并不是太大了,能够通过失真变化得到更多的场景内容则变得更加有意义。