C#开发-语音合成

本文主要讨论C#开发使用百度语音合成API在线将文本内容合成语音，保存为 MP3 文件，本文最后会提供本安全源代码以及运行软件包，如有需要可自行下载

开发流程如下：

1. 创建百度应用：

　　创建应用之后就能看到创建完的应用和 API KEY 以及 Secret KEY了，在调用API时需传入这些配置值

　　详见：https://console.bce.baidu.com/ai/#/ai/speech/overview/index

2. 引用 Baidu.Aip (SDK)

　　Baidu.Aip 封闭了文字识别Ocr API 的Http请求，简化代码，提高开发效率。如果不想引用该DLL，可以自己封装Http请求方法。

　　C# SDK 现已开源，快速接入文档参考：https://ai.baidu.com/ai-doc/SPEECH/Jk4nlz6gp

3. 调用API，

　　这里仅展示通用及高精度识别示例，特殊场景识别，详见官方文档：https://ai.baidu.com/ai-doc/SPEECH/Jk4nlz6gp

        /// <summary>
        /// 语音合成
        /// </summary>
        /// <param name="reqItem">请求相关参数</param>
        /// <param name="destPath">mp3文件保存路径</param>
        /// <param name="synthesisEvent">状态事件</param>
        /// <returns></returns>
        public static bool Synthesis(ReqSynthesis reqItem, string destPath, SynthesisEvent synthesisEvent)
        {
            bool callResult = false;

            try
            {
                synthesisEvent("语音合成初始化...");
                string appId, apiKey, secretKey;
                if (!RiverAuth.Instant.GetSpeechApiConfig(true, out appId, out apiKey, out secretKey))// 读取应用配置
                {
                    synthesisEvent("当天使用次数已达上限或配置无效。");
                    return false;
                }
                var client = new Baidu.Aip.Speech.Tts(apiKey, secretKey);
                client.Timeout = 60000;  // 修改超时时间
                var option = new Dictionary<string, object>()
                {
                    {"vol", reqItem.vol}, // 
                    { "pit", reqItem.pit}, // 
                    {"spd", reqItem.spd}, // 语速
                    {"per", reqItem.per}  // 发音人，4：情感度丫丫童声
                };
                synthesisEvent("开始语音合成...");
                var result = client.Synthesis(reqItem.tex, option);
                // 保存文件
                if (result.Success)  // 或 result.Success
                {
                    File.WriteAllBytes(destPath, result.Data);
                    synthesisEvent("语音合成返回成功，文件：" + destPath);
                    callResult = true;
                }
                else
                {
                    synthesisEvent(string.Format("语音合成失败, 错误码：[{0}], 原因：{1}", result.ErrorCode, result.ErrorMsg));
                }
            }
            catch (Exception ex)
            {
                synthesisEvent("语音合成失败，原因：" + ex.Message);
                LogHelper.LogError(ex, "语音合成");
            }
            return callResult;
        }
    }
    /// <summary>
    /// 语音合成请求
    /// </summary>
    [Serializable]
    public class ReqSynthesis
    {
        public string tex { get; set; }//合成的文本，使用UTF-8编码，请注意文本长度必须小于1024字节 必填项
        public string cuid { get; set; }// 用户唯一标识，用来区分用户，填写机器 MAC 地址或 IMEI 码，长度为60以内 否
        public int spd { get; set; }//语速，取值0-9，默认为5中语速 否
        public int pit { get; set; }//音调，取值0-9，默认为5中语调 否
        public int vol { get; set; }//音量，取值0-15，默认为5中音量 否
        public int per { get; set; }//发音人选择, 0为女声，1为男声，3为情感合成-度逍遥，4为情感合成-度丫丫，默认为普通女
    }
    /// <summary>
    /// 语音转文字返回结果
    /// </summary>
    public class RetSpeech
    {
        public string corpus_no { get; set; }
        public string err_msg { get; set; }
        public int err_no { get; set; }
        public string[] result { get; set; }
        public string sn { get; set; }
    }

4. 语音合成最后保存为 MP3 文件

5. 源代码及软件包下载

软件开源代码地址(项目集成文字识别、语音合成、语音识别)：https://gitee.com/bidev_admin/river-int-ai.git

运行软件包下载地址(.Net Framework 4.5)： https://pan.baidu.com/s/1z-WFDGHhEP8tqLqwp9I0Mw 提取码: r3sk

posted @ 2020-12-14 10:24 沐汐Vicky 阅读(823) 评论(0) 收藏举报

刷新页面返回顶部

沐汐 vicky

我想改变这个世界，但我没有源代码

C#开发-语音合成

公告