2025 年 3月 4 日随笔档案 - 声网 - 博客园

2025年3月

Gemini AI 升级视频提问和屏幕共享功能；Voice+Visual Agent Demo：语音对话与视觉互动元素结合丨日报

摘要：开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑阅读全文

posted @ 2025-03-04 18:31 声网阅读(24) 评论(0) 推荐(0) 编辑

公告

昵称：声网
园龄： 4年7个月
粉丝： 3
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:实践解析丨如何通过 WebAssembly 在 Web 进行实时视频人像分割
有没有看到效果的demo？
--谈晓鸣
2. Re:如何基于实时声纹变声实现对声音的“克隆”
最近有很多声音克隆的项目开源了，比如coqui、gpt-sovits、openvoice等，如果将这些模型的声音克隆参数整合到声卡里是不是就可以制作一款拟人的变声器出来了？
--ShangFR
3. Re:如何基于实时声纹变声实现对声音的“克隆”
现在你们完成声纹转换需要多少原始和目标语料数据？现在国内非实时好像也没有做特别好的吧。
--fredric_2022