审听训练与音质主观评价——笔记
Chap01. 声音与人耳听觉
生理听觉
人耳的结构分为外耳、中耳和内耳,如下图:
- 外耳的耳廓首先会对到来的声音进行一定程度的反射,这些细微的变化能够辅助人即使在利用单耳时识别声音的方向(耳廓效应)
- 由于鼓膜的阻挡,耳道是一个封闭的管子,这种结构具有管共振效应,最佳共振频率约为3.4kHz,这部分的声音由于共振被加强,导致人耳对此敏感
- 鼓膜被声波驱动,从而驱动与其连接的听小骨,听小骨由三块骨头链状衔接组成,分别是锤骨、砧骨和镫骨
- 锤骨附着在鼓膜上,镫骨则附着在耳蜗的卵圆窗上,耳膜驱动锤骨,锤骨驱动砧骨,然后是镫骨,最终到达卵圆窗。
- 耳蜗由蜗管卷曲起来形成蜗牛状,是一个换能器,负责将接收到的震动转化为生物电信号传递给
- 耳蜗中充满液体,震动使得液体产生波纹
- 波纹推动毛细胞术运动,从而产生电信号
- 耳蜗底部的毛细胞能够检测高音调的声音,而顶部则用于检测低音调的声音
耳蜗不同区域对音调的感知:
心理听觉
- 音高虽与频率相关,但强度也会引起音高感知变化
- 响度虽与强度相关,但与频率也相关
- 音色虽与频谱相关,但瞬态特性也会产生影响
思考题
本人的想法,不一定准确
-
人耳可听频率范围是多少,频率与音高有什么样的关系
20Hz到20kHz,基频越高我们听到的音高越高
-
声压与声压级的关系如何?声压增加一倍,声压级提高几分贝?
声压是声音震动对空气的扰动程度,是在本来的大气压下叠加上去的压强。声压级是声压与参考声压级的比值取常用对数再乘以20,用于以更小的数字表示声压大小。后面一个问题不会算。
-
乐音与噪音从物理属性上的区别是什么
乐音的振动有明显的基波,可以识别音高,噪音的震动杂乱无章,无明显基波,无法识别音高
-
粉红噪声的名称由来是什么?与白噪声有何区别?
-
根据人耳的构造,说明为什么人耳对3kHz到4kHz的声音最敏感
外耳道和鼓膜形成了一段封闭的管,人耳普遍的形状导致该管的最佳共振频率是3.4kHz左右,所以3k到4k的声音得到了加强
Chap02. 音高感知与频谱均衡
Chap05. 空间感知与声场建立
声源空间感知原理
第一小节主要探讨了什么影响我们对声源的空间感知。探讨了水平垂直方向定位、距离定位、感知声源宽度、多声源合成定位以及混响带来的空间感。
方位坐标图
声源方位可以由下图坐标系\((\phi, \theta, r)\)表示,\(\phi\)是声源对于听音者的垂直方位角,\(\theta\)是水平方位角。
\(\phi\)确定水平面,\(\theta\)确定中垂面,当\(\phi = 0, \theta=0\)时,声源位于听音者正前方。
方向定位
当\(\phi\)固定,即在水平面上,\(\theta\)移动时
- 人对正前方的方向分辨率最高(1到3度)
- 随着向侧方移动,方向辨别阈(人耳察觉方位变化的最小角度,越小越好)逐渐增加,正左侧和正右侧最大,约为正前方的3到10倍
- 随着移动到后方,辨别阈逐渐减小,约为正前方的2倍
说明声音在水平面的不同方位人耳的感知灵敏度是不同的,正前方最灵敏,左右侧最不灵敏,后侧稍微灵敏一些也比不过正前方
自由场(理想声学环境,声波自由传播,不受任何反射、吸收或散射的影响)下,对单一声音方向定位因素包括:
-
双耳效应:由双耳信号差异产生的定位效应,时间差、声压级差,主要用于水平方向定位
- 双耳时间差(ITD):当声音位于中垂面时,ITD=0,当位于正侧方时,ITD最大,约为0.6到0.7ms。研究结果表明频率\(f>=1.5kHz\)时ITD不再起主要作用
- 双耳声级差(ILD):频率\(1.5kHz<f<4kHz\)时,ITD和ILD同时起作用,\(f>4kHz\),ILD为有效定位因素
-
耳廓效应:当声源处于垂直方向不同位置时,由于声音到达位置不同,经耳廓不同程度的反射后,反射声和直达声之间的强度比、在不同频率上的时间差以及相位差会在鼓膜处形成一种与声源方向位置有关的频谱特性。导致我们识别出声音的垂直位置
下图为声源位于中垂面,仰角分别为-10、0以及10度时在人头模型上测得的耳廓响应曲线,响应变化主要集中在高频
-
人头转动
距离定位
-
响度(自由场):距离增加一倍声压级下降6dB
-
直达声和混响声的声能比:混响半径\(r_r\)是指直达声和混响声声能相等的位置,当声源距离\(r<r_r\)时,直达声为主,响度起主要作用,当\(r>r_r\)时,混响声为主,总声压级几乎恒定,响度不再起作用,直达声与混响声的声能比\(D/R\)为估测距离的有效因素
-
空气对声波的吸收所引起的高频衰减:声源非常远时起作用,普通房间尺寸忽略
感知声源宽度(ASW)
- 早期反射声是影响ASW的重要因素,取决于早期反射声的宽度和延时时间
- 人们偏爱更宽阔的ASW
- IACC_e越小,ASW越宽
- 侧向声能比LF越高,ASW越宽
多声源的合成定位感知与建立
- 各个声源产生不相关的声波
- 听觉系统可以分别定位每个声源
- 各个声源产生相关的声波
- 听觉系统可能将其定位在其中一个声源的位置,或定位在根本没有声源的空间位置(虚拟声像)
产生虚拟声像的原因:当多声源叠加后的全部或部分信号所带来的定位信息(ITD、ILD)与位于某空间方位的单声源情况相同时,听音系统就会在那个假想的单声源方向上形成声像。立体声就是利用了这一特性。所以耳机这种左右声道直达声的设备,缺乏crosstalk,不会形成立体声声像(Sound Image)
混响:对声源所处环境的感知
当处于密闭房间中,听到的声音可以分为直达声、早期反射声以及混响。人耳可以通过混响来形成空间印象(Spatial Impression),从而感知声源的所处环境
- 对房间大小的感知:主要由早期反射声决定(50ms+)
- 对房间混响的感知:与混响时间有关。除此之外还有早期声能衰变时间、房间的体型、声源类型等
- 对环绕感(空间感,Listener Envelopment,LEV)的感知
- 后期反射声,后期侧向声级与LEV关系最大
- 除了前向声级对LEV没有影响,侧向、顶向和后向声都对LEV有很大关联