教程|腾讯云高性能应用服务(HAI)搭建多音色控制的TTS引擎
在这篇文章中,我们将介绍如何使用腾讯云的高性能应用服务(HAI)来搭建一个具有多音色控制的文本转语音(TTS)引擎,具体操作步骤如下:
点击 新建 选择 AI 框架,选择算力方案、输入 实例名称、选择数量 后立即购买
开启学术加速功能
完成创建,查看运行状态
进入 jupyter_lab 环境
安装 git-lfs:
apt-get clean && apt-get update
apt-get install git-lfs
克隆 EmotiVoice 仓库:
cd /root && git clone https://github.com/netease-youdao/EmotiVoice
下载预训练模型文件:
cd /root/EmotiVoice
git lfs install
git lfs clone https://www.modelscope.cn/syq163/WangZeJun.git
下载 ckpt 模型:
cd /root/EmotiVoice
git lfs clone https://www.modelscope.cn/syq163/outputs.git
安装 EmotiVoice 依赖:
pip install numpy numba scipy transformers==4.26.1 soundfile yacs g2p_en jieba pypinyin
运行 UI 交互界面:
pip install streamlit
cd /root/EmotiVoice && streamlit run demo_page.py --server.port 6889 --logger.level debug
启动命令中的 6889 端口是 高性能应用服务默认开放的端口之一,如果修改了启动命令中的端口,需要手动配置 HAI 的安全组策略,将服务端口放行
运行类 OpenAI TTS 的 API
# 安装ffmpeg
apt-get clean && apt-get update
apt-get install ffmpeg
# 安装API所需的依赖
pip install fastapi
pip install pydub
pip install uvicorn[standard]
# 运行服务
cd /root/EmotiVoice
uvicorn openaiapi:app --reload --host 0.0.0.0 --port 6006
启动后可以通过/docs 查看接口文档
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧