有没有看到效果的demo?
最近有很多声音克隆的项目开源了,比如coqui、gpt-sovits、openvoice等,如果将这些模型的声音克隆参数整合到声卡里是不是就可以制作一款拟人的变声器出来了?
现在你们完成声纹转换需要多少原始和目标语料数据?现在国内非实时好像也没有做特别好的吧。