赛题要点

着力于解决歌唱声音转换问题。歌唱声音转换可以为每一个人搭建歌唱数据集,可以学习目标人音色,使用音频相关深度算法和模型框架,完成歌曲中的音色替换。要求能够设计一个在不使用GPU的环境下运行, 在精细度、速度和模型大小上取得平衡的最佳化的算法模型。

此外还要求实施者自行以收集开源数据或自主建立数据的方式收集数据、建立音频多人声分离算法模型。并完成模型训练、优化、工程化(python或C++皆可)等工作,最终产出一个可执行程序,针对5个目标音色进行歌唱声音转换。

将目标音色迁移到想唱的歌曲上,具体要求如下:输入目标人声,选定需要转唱的歌曲,使用目标人音色替换原始人音色,并保证音频的质量不会发生太大的降低,需要保证替换音色后的音频在自然度和相似性上可以得到保证,最后将生成的歌曲和伴奏整合,输出转唱的歌曲。

 

啰啰嗦嗦一大堆,说白了就是向搭建一个类似虚拟歌姬的程序,只不过使用的不是捏造出来的声音而是真人(或者更改过的真人声线)

…这让我莫名想起了东方栀子,而栀子早在11年就已经诞生了,她当时就是采用是UTAU(歌声合成)和袅袅的音源

这和选题几乎是…

posted @ 2024-03-14 23:48  椰子灰  阅读(19)  评论(0编辑  收藏  举报