i人的福音!一个强大开源的文本转语音工具!
大家好,我是 Java陈序员
。
现在的自媒体可谓是十分火热,各个视频剪辑软件提供了文本生成语音的功能,但大多都是千篇一律的音色,比如“这个男人叫小帅”。
如果你想做自媒体,既不想录制自己的语音,又想自己的视频配音与他人不同,可以考虑使用大模型来训练生成自己的语音。
今天,给大家介绍一个开源免费的文本转语音工具,支持十几种语言生成!
关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。
项目介绍
EmotiVoice
—— 一个强大的开源 TTS
引擎(Text To Speech,即文本转语音),完全免费开源!
EmotiVoice
供了一个易于使用的 Web 界面用于文本转语音,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
此外,EmotiVoice
还提供了用于批量生成结果的 API 接口。
项目使用
启动工具
EmotiVoice
的使用方法十分简单,在 Windows 环境下,解压软件压缩包后,双击运行 start.bat
即可启动。
双击运行 start.bat
后,将会在 CMD 命令窗口中运行服务:
并在浏览器中自动打开 Web 界面:
单句合成
1、选择说话人,工具提供了十几种不同的男女音色供选择
2、选择情绪,工具提供了普通、生气、开心、惊讶、悲伤、厌恶、恐惧等语音情绪
3、输入合成文本
4、点击合成
5、合成的音频可以进行在线播放和下载,或者在合成时勾选生成音频后直接保存在wav_file目录下
故事剧本多人合成
EmotiVoice
除了提供单句合成,还提供了故事剧本多人合成的功能。
1、输入角色和文本
2、为角色选定声音情感
3、为角色选定配音员
4、点击合成音频
快速上手
完整安装
conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
更多的模型训练,可参考项目文档。
Docker 部署
尝试
EmotiVoice
最简单的方法是运行 Docker 镜像,需要一台带有 NVidia GPU 的机器!
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
容器启动成功后,访问:
http://localhost:8501/
EmotiVoice
作为一款 TTS 引擎,可以说功能十分强大,而且开源免费,大家快去围观体验吧~
项目地址:https://github.com/netease-youdao/EmotiVoice
最后
推荐的开源项目已经收录到 GitHub
项目,欢迎 Star
:
https://github.com/chenyl8848/great-open-source-project
或者访问网站,进行在线浏览:
https://chencoding.top:8090/#/
大家的点赞、收藏和评论都是对作者的支持,如文章对你有帮助还请点赞转发支持下,谢谢!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库