10 2019 档案
摘要:音频分类前置知识 音频 音频常常被表示为波形图,其中横轴为时间,纵轴为幅值。音频多种多样,分类中一般分为语音、音乐、噪音、静音和环境音等。 采样频率 每秒从模拟信号中采集的样本个数,基本单位为 。信号的采样频率一般遵循奈奎斯特采样定理,即采样频率必须大于被采样信号最高频率的两倍。一般而言: 为电话信
阅读全文
摘要:对于语音通信而言,语音码率较低,添加适当冗余是对抗网络丢包的常见方式。冗余方式有多种,包括 ,`FEC RFC 3350 RFC 2198 RFC 5109`是添加FEC数据的RTP封装标准协议。 RTP格式(RFC 3350) 文档地址: "RTP: A Transport Protocol fo
阅读全文
摘要:NetEQ使得WebRTC语音引擎能够快速且高解析度地适应不断变化的网络环境,确保了音质优美且缓冲延迟最小,其集成了自适应抖动控制以及丢包隐藏算法。 WebRTC和NetEQ概述 WebRTC WebRTC (Web Real Time Communications) 是一项实时通讯技术,它允许网络
阅读全文
摘要:VoIP基本原理 VoIP是通过Internet等互联网络传递语音信息的,主要包括终端设备、网关、网守和网络管理等部分。网关负责提供IP网络和传统的 接口。 VoIP的基本原理:通过语音压缩算法对语音数据进行压缩编码处理,然后将语音数据按照 标准打包,经过 网络把数据包发送到接收端,之后将语音数据包
阅读全文
摘要:,`accelerate.cc` 加速操作,对语音信号处理以实现快速播放。 类继承自父类 ,大多数功能由 实现。 从|input|中读入长度为|input_length|的样本点;输出到算法缓冲区|output|中;改动的样本点数为|length_change_samples|;当fast_acce
阅读全文