多媒体技术 2023-03-11
音频的获取与处理
2.1声音的基础知识
声音的三个要素是音调、音强和音色。
音调是指声音的高低,由频率决定。高频率的声音听起来高,低频率的声音听起来低。 音乐中按音阶来表示音调的高低。赫兹Hz
音强是指声音的响度,即声音的强弱。响度取决于声音的振幅,振幅大的声音听起来响亮,振幅小的声音听起来轻柔。分贝db
音色是指声音的音质特点,是由声音波的组合产生的【谐波】。不同的乐器或声源会产生不同的音色。例如,钢琴的音色和吉他的音色是不同的,即使它们发出的是相同的音调和音强。除基音之外的高次谐波越丰富,音色就越有明亮感和层次感。
人可以听到的声音的频率范围约为20 Hz至20,000 Hz。这个范围称为听觉频率范围,它因人的年龄、性别和健康状况等因素而略微有所不同。婴儿和小孩可以听到更高频率的声音,而老年人可能听力下降,不能听到高频率的声音。
规则声音是指具有规则性、周期性的声音,例如人类说话、乐器演奏等都是规则声音。这类声音具有可测量的频率和振幅,能够被分析成一系列频率成分的叠加。规则声音的谱线呈现规则的共振峰,这些峰标志着声音特征的出现和消失。常见的规则声音包括语音、音乐、动物鸣叫等。
不规则声音则是指没有明显规律性、周期性的声音,例如雨声、嗓音、风声等。这类声音无法被分析成规则的频率成分,具有复杂的频率谱,难以精确地描述和分析其声波形态。不规则声音往往显得更加随意、自由,而不像规则声音那样受到固定规律的限制。
2.2 声音的数字化
模拟音频-->采集,量化,编码-->数字音频
1. 采集声音信号:使用麦克风等设备将声音转化成电信号。 2. 声音信号的预处理:将信号进行滤波、增益控制等处理,使其达到数字化的要求。 3. 采样:使用模数转换器将信号按照一定的时间间隔进行采样,将模拟信号转化为离散的数字信号。 4. 量化:使用模数转换器将采样后的信号的幅度值进行离散化。 5. 编码:使用编码器将量化后的数字信号转化为不同的二进制编码。 6. 存储或传输:将编码后的数字信号存储到存储介质中,或者通过网络传输到接收端。 7. 解码:接收端对传输过来的数字信号进行解码,恢复原先的数字信号。 8. 数字信号重建:使用数字信号处理技术对解码后的数字信号进行去噪、滤波等处理,恢复出原来的声音信号。
音频数字化的硬件设备
1.集成式
2.板卡式
3.外置式
声卡的功能
进行A/D转换
进行D/A转换
实时动态地处理数字化声音信号
输入和输出接口
mp3是有损压缩
脉冲编码调制pulse code modulation
音频数字化的4个设置参数
采样率
位深度
声道数
编码格式
数字音频文件的比特率bps
比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量
比特率=采样数*位深度*声道数目
文件大小=比特率*时长/8
7种常见的音频格式简析 MP3,WMA,WAV,APE,FLAC,OGG,AAC - 知乎 (zhihu.com)
声音文件的格式
有损压缩mp3,wma,ogg
无损压缩wav, ape, flac
APE是现在流行的数字音乐文件格式之一,与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。
而容量方面,APE的文件大小大概为WAV的一半左右。虽然,这个比例并不是很高,和MP3那种1/10-1/12的压缩比率难以相提并论,但是随着宽带的普及,大量下载APE格式已成为可能。
简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。
常用的音频软件
GoldWave
CoolEdit
SoundForge
CuBase
Adobe Audition
作者:Chuck Lu GitHub |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2022-03-11 CSS opacity 属性
2021-03-11 nvarchar(max) still being truncated
2020-03-11 The view 'Index' or its master was not found.
2019-03-11 JMeter -- Getting Started
2019-03-11 237. Delete Node in a Linked List
2016-03-11 SuperSocket中的Server的初始化和启动
2016-03-11 SuperSocket中的Server是如何初Start的