i人的福音!一个强大开源的文本转语音工具!

大家好,我是 Java陈序员

现在的自媒体可谓是十分火热,各个视频剪辑软件提供了文本生成语音的功能,但大多都是千篇一律的音色,比如“这个男人叫小帅”。

如果你想做自媒体,既不想录制自己的语音,又想自己的视频配音与他人不同,可以考虑使用大模型来训练生成自己的语音。

今天,给大家介绍一个开源免费的文本转语音工具,支持十几种语言生成!

关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。

项目介绍

EmotiVoice —— 一个强大的开源 TTS 引擎(Text To Speech,即文本转语音),完全免费开源!

EmotiVoice 供了一个易于使用的 Web 界面用于文本转语音,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

此外,EmotiVoice 还提供了用于批量生成结果的 API 接口。

项目使用

启动工具

EmotiVoice 的使用方法十分简单,在 Windows 环境下,解压软件压缩包后,双击运行 start.bat 即可启动。

双击运行 start.bat 后,将会在 CMD 命令窗口中运行服务:

并在浏览器中自动打开 Web 界面:

单句合成

1、选择说话人,工具提供了十几种不同的男女音色供选择

2、选择情绪,工具提供了普通、生气、开心、惊讶、悲伤、厌恶、恐惧等语音情绪

3、输入合成文本

4、点击合成

5、合成的音频可以进行在线播放和下载,或者在合成时勾选生成音频后直接保存在wav_file目录下

故事剧本多人合成

EmotiVoice 除了提供单句合成,还提供了故事剧本多人合成的功能。

1、输入角色和文本

2、为角色选定声音情感

3、为角色选定配音员

4、点击合成音频

快速上手

完整安装

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict

更多的模型训练,可参考项目文档。

Docker 部署

尝试 EmotiVoice 最简单的方法是运行 Docker 镜像,需要一台带有 NVidia GPU 的机器!

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

容器启动成功后,访问:

http://localhost:8501/

EmotiVoice 作为一款 TTS 引擎,可以说功能十分强大,而且开源免费,大家快去围观体验吧~

项目地址:https://github.com/netease-youdao/EmotiVoice

最后

推荐的开源项目已经收录到 GitHub 项目,欢迎 Star

https://github.com/chenyl8848/great-open-source-project

或者访问网站,进行在线浏览:

https://chencoding.top:8090/#/

大家的点赞、收藏和评论都是对作者的支持,如文章对你有帮助还请点赞转发支持下,谢谢!

posted @ 2024-07-22 09:44  Java陈序员  阅读(235)  评论(0编辑  收藏  举报