《语音信号处理》《第2章 语音信号的声学基础及产生模型》
语音学三个分支:
1. 发音语音学
2. 声学语音学----进一步出现了声音模拟、语音合成、语音识别
3. 听觉语音学和心理语言学----研究人耳和大脑
本章介绍语音产生的过程及人耳的听觉过程,传统的线性语音产生模型以及目前广泛受到重视的非线性
语音产生模型,这些都是从事语音信号处理研究的基础知识。
2.1 语音信号的产生
声带振动产生声音,这是产生声音的基本声源,称为声带音源。
基音周期
基音频率 80Hz - 500Hz
声道
浊音 voiced sound 声带振动产生的
清音 unvoiced sound
语音是以声波的方式在空气中传播。声波是一种纵波,它的振动方向和传播方向是一致的。
复合音
纯音--仅仅有基音,没有倍音。
法国物理学家傅里叶发现了各个声音之间的区别在于和弦(chord)的不同。
之所以能够听出每种乐器都有自己特殊的音色,就是因为它们的和弦不同。
一个声音的基音与倍音,共同组成这个声音的和弦。
在复合音中,基频的频率最低,但振幅最大。其余各个倍音的能量逐渐地减少,振幅就逐渐减小。
2.1.3 语音信号在时域和频域的表示
频谱是是表征语音特性的基本参数。其中共振峰就是一个典型的频域参数,它可以决定信号频谱的
总体轮廓或谱包络。
一般假设语音信号是一种短时平稳信号。时频分析,小波变换
语谱图----时频图
2.1.5 汉语语音的韵律特性
语音的声学特征是指音色、音高、音长和音强。
汉语中,主要靠音色和音高来区别语义,而音强和音长不能区别语义。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix