Eban

导航

2024年6月7日 #

SVC数据集准备及预处理

摘要: 此文档主要为SVC数据集预处理的详细步骤。 音源准备 时长要求:训练音源需准备至少20min以上,最好是1-2小时的数据。注:由于歌曲中歌手并不会整首歌都在演唱,因此这里的时长说的是歌手实际演唱的时长,不包括前奏、间奏等无歌声的部分。 质量要求:训练音源尽量使用高保真及以上品质的音频。高质量音频会保 阅读全文

posted @ 2024-06-07 15:32 Eban 阅读(108) 评论(0) 推荐(0) 编辑

SVC推理参数说明

摘要: WebUI参数说明 选择主模型文件 主模型配套的配置文件 主模型配套的扩散模型 扩散模型配套的配置文件 聚类模型或特征检索。(可选) 聚类模型:需单独训练聚类模型,其可以减小音色泄露,使得音色更接近于原声(效果不是很明显)。单纯的完全使用聚类模型,会导致出现口齿不清,降低咬字的情况。因此,需要设置好 阅读全文

posted @ 2024-06-07 15:31 Eban 阅读(191) 评论(0) 推荐(0) 编辑

AI变声、翻唱之SVC(so-vits-svc)部署、训练、推理

摘要: 前言 最近在做AI变声和AI翻唱相关调研,主要还是考察了SVC和RVC两款AI模型。本篇文章主要是SVC的部署、训练、推理说明文档。原文来自于so-vits-svc-Deployment-Documents/README_zh_CN.md at 4.1 · SUC-DriverOld/so-vits 阅读全文

posted @ 2024-06-07 15:30 Eban 阅读(4485) 评论(2) 推荐(0) 编辑