赛题要点

着力于解决歌唱声音转换问题。歌唱声音转换可以为每一个人搭建歌唱数据集,可以学习目标人音色,使用音频相关深度算法和模型框架,完成歌曲中的音色替换。要求能够设计一个在不使用GPU的环境下运行, 在精细度、速度和模型大小上取得平衡的最佳化的算法模型。

此外还要求实施者自行以收集开源数据或自主建立数据的方式收集数据、建立音频多人声分离算法模型。并完成模型训练、优化、工程化(python或C++皆可)等工作,最终产出一个可执行程序,针对5个目标音色进行歌唱声音转换。

将目标音色迁移到想唱的歌曲上,具体要求如下:输入目标人声,选定需要转唱的歌曲,使用目标人音色替换原始人音色,并保证音频的质量不会发生太大的降低,需要保证替换音色后的音频在自然度和相似性上可以得到保证,最后将生成的歌曲和伴奏整合,输出转唱的歌曲。

 

啰啰嗦嗦一大堆,说白了就是向搭建一个类似虚拟歌姬的程序,只不过使用的不是捏造出来的声音而是真人(或者更改过的真人声线)

…这让我莫名想起了东方栀子,而栀子早在11年就已经诞生了,她当时就是采用是UTAU(歌声合成)和袅袅的音源

这和选题几乎是…

posted @   椰子灰  阅读(21)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
历史上的今天:
2023-03-14 【结对作业】第一周 | 学习体会day02
2023-03-14 Android Studio学习笔记1
点击右上角即可分享
微信分享提示