即构SDK新增焦点语音功能，可实现特定用户语音的聚焦

2021年，即构SDK每月迭代如期而至。今年，我们会着重介绍每月SDK的重要新增功能，让大家更清晰的了解到这些新功能的特性及应用场景。

重点新增功能

多人语音通话场景下的焦点语音功能

功能介绍

即构SDK1月新增焦点语音功能，适用于超多人语音通话场景，在多人同时说话的嘈杂环境下，依旧能聚焦特定用户的语音。支持开启多路混音模式，开发者通过设定拉流端在多路混音时要突出的目标流声音，实现特定用户语音的聚焦。

适用场景

随着疫情的反弹，全国各地中小学陆续叫停了线下教学活动，转而用空中课堂等线上的方式完成日常教学。因而，搭建一个尽可能还原现实课堂的线上教课空间，是实现高效教学的关键。

空中课堂一般为学校课程的线上化，不仅课堂人数规模大，还有像朗读、体育、音乐等此前未大规模线上化的课程，因此需要根据学科特色持续不断的优化空中课堂教学效果。以朗诵为例，既有单人朗读，也有学生齐声诵读的场景，在多人同时朗读时，老师需要分辨出不同学生的声音，进而提供针对性的指导。

即构“焦点语音”功能，让多个学生朗读时，也可实现聚焦特定学生声音。在热烈的课堂氛围中保证老师与学生以自然的方式进行互动，助力“空中课堂”实现高效的课堂教学监督，展现线上教学系统的优势。

功能优势

即构焦点语音功能，解决了空中课堂等线上教育场景下，教师同时监督多位学生朗读和学习状态的痛点。

从技术角度看，当一个线上教学课堂内有N个连麦通话的人，则课堂上每位成员的设备系统会输出 N-1 条音频流的数据。此时，降低设备性能开销和识别特定的说话人员，是首要考虑的技术难点。即构推出了多路混音模式，通过后台混音机制，降低用户拉取多路音频流带来的设备性能开销，同时提供突出音频流的列表，聚焦在特定的用户说话声音上，在喧闹的环境中仍支持清晰的语音通话。

其他新增功能

1.新增多种音效效果

SetVoicePreset 接口新增多种预设声音音效：清澈、高亢、嘹亮、饱满、假音、圆润、低沉、浑厚、女活力，增加实时语音趣味性。

SetReverbPreset 接口新增多种预设混响音效：嘻哈、飘渺、3D人声、留声机，可用于烘托房间氛围。

2.视频内部采集新增支持设置旋转角度

推流端启用视频内部采集旋转功能，可设置视频输出的画面方向。在教育场景中，可调整使用高拍仪设备的拍摄角度，达到教师端与学生端画面视角观看一致的体验。

新增接口 SetCaptureFrameRotation，设置逆时针旋转 0°（默认值）、90°、180°、270°，支持在推流过程中使用。

3.新增本端设备摄像头状态回调（Windows）

新增摄像头状态回调功能，当本端设备的摄像头发生改变时，可获取相关的状态变化事件，可用于判断摄像头设备是否正常工作。

4.拉流质量回调新增音频和视频卡顿统计指标

新增多个拉流质量回调指标：音频和视频卡顿累计次数、音频和视频卡顿累计时长、音频和视频解码累计时长。方便开发者了解拉流端在 RTC 通话场景中音频和视频的质量，通过数据洞悉业务表现。

此外，还新增了流控触发模式、摄像头权限状态查询、设置系统声卡采集音量、设置拉流缓存区间值等多项功能，实现更优质的音视频体验。完整的SDK迭代内容，欢迎进入“ZEGO-开发者中心”查看。

posted @ 2021-01-28 11:24 ZEGO即构阅读(119) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡：英雄联盟客户端的OpenSilver迁移实战
· 永远不要相信用户的输入：从 SQL 注入攻防看输入验证的重要性
· 全网最简单！3分钟用满血DeepSeek R1开发一款AI智能客服，零代码轻松接入微信、公众号、小程

公告

昵称： ZEGO即构
园龄： 4年10个月
粉丝： 3
关注： 0

+加关注

2025年2月

日

一

二

三

四

五

六

ZEGO即构

即构SDK新增焦点语音功能，可实现特定用户语音的聚焦

公告

搜索

常用链接

我的标签

合集

随笔分类

随笔档案

阅读排行榜