WINCE TTS语音合成引擎SDK

WINCE 捷通语音合成引擎，成熟稳定，提供例子程序和SDK，提供技术支持。

WINCE 语音合成有下列技术特点：

1，声音清晰（清脆）

2，语速可以调节

3，占用系统资源少，对系统要求少

4，代码占用空间少

5，编程接口方便

6，声音甜美

7，技术成熟可靠

8，支持C++、C#、VB.NET语言编程

9，朗读音量可以调节

WINCE 6.0 TTS语音合成演示测试软件下载

WINCE 5.0 TTS语音合成演示测试软件下载

技术咨询QQ：1005974096

1. 概述
进入21 世纪，互联网技术与移动通讯技术的高速发展，使得嵌入式产品在人们生活、
学习、工作中的应用越来越普及，手机、个人数字助理(PDA)等嵌入式产品已成为人们必不
可少的通讯与信息获取工具。同时，为了让人们更方便的使用各种电子设备，摆脱单一晦涩
的人机交互方式，使机器“能听、能看、能说”，应用人类自然形成的交流手段，方便人们
与机器之间的信息交流，这已成为当前嵌入式产品发展的一个重要方向。
智能人机交互技术是指能够实现人与机器之间进行自然交互的手段，其中包括语音合
成、语音识别、手写识别、指纹识别、机器翻译等多项技术。近年来语音合成、语音识别、
手写识别等智能人机交互技术的长足进步，有力地促进了机器进入“能听、能看、能说”的
自然人机交互（NUI）阶段。语音，凭借其自然、灵活、便捷的交互方式，也已成为重要的
人机交互手段。
如今，基于大语料库的语音合成技术已经比较成熟，合成语音自然度较高，可广泛的应
用

2.1. ejTTS 6.0 特性
支持多种规模的音库，满足各类需求；
支持合成语音的不同采样率、比特率、格式输出；
支持用户定制化需求；
支持多种压缩参数和谱参数引擎；
支持动态音频参数规划；
支持流式文本输入；
支持进度通知；
支持同步回显拼音输出；
全新架构，具有高可靠的稳定性。

2.2. 高品质的语音合成效果
由于采用了新的语音合成算法，ejTTS 在合成效果上已经接近传统大语料库语音合
成算法的效果，与以往的嵌入式语音合成软件相比，合成语音更加自然和流畅。
由于采用了一体化的智能文本分析算法，结合统计和规则等处理手段，ejTTS 的文
本处理前端拥有较强的分词、多音字、韵律环境预测能力，以及自动识别和处理日
期时间、数值金额、电话号码等文本的能力。
针对文本变化范围可事先预知的领域，谱参数引擎可根据用户需求，通过制作定制
音库和优化文本分析的方法，使得合成效果更为准确和自然。
2.3. 极低的资源需求
整体软件架构的设计紧凑高效；
软件开发过程中，在合成算法、数据结构、代码编写等不同层面都进行了深入优化；
资源的结构设计也非常精巧，既降低了资源的尺寸，又提升了资源访问的效率。

2.4. 良好的系统移植性
ejTTS 对不同的硬件和软件环境有极强的适应能力和移植能力，通过对与环境相关
部分的抽象设计，只要极少量的代码修改，即可快速满足不同环境下的需求；
ejTTS 支持多种资源配置方案，既可配置到支持线性访问的Nor Flash 存储器中，
也可配置到分块访问的Nand Flash 中，如果环境支持文件系统，还可以以文件的
方式配置；

2.5. 高度可裁减性
算法可裁减，面对多种环境的提供多种不同复杂度的算法以供选择，相应的对动态
RAM 资源的需求也会有所变化；
尺寸可裁减，对不同的效果要求，资源的尺寸可大可小，具有很大的伸缩性。
2.6. 强大的定制能力
ejTTS 灵活的系统架构，使得功能的任意配置成为可能，用户可以决定是否采用或
者去除某个处理算法或模块；
ejTTS 针对多种行业进行了语音合成算法优化和定制音库的服务。捷通华声公司拥
有专门的数据定制小组负责定制内容服务，按照用户的需求，录制和制作语音合成
定制音库，可在极短的时间内满足用户的定制需求。
2.7. 丰富的控制接口
根据捷通公司在嵌入式领域多年的开发经验，我们为调用语音合成模块的用户提供了许
多方便体贴的接口，以满足用户不同的需求。
实时的对合成进度的反馈。在文本的合成过程中，实时通知上层应用文本的合成信
息：包括当前文本的合成位置、当前所合成文字，以及该字的音素信息（拼音或音
标）等。该功能让上层应用可以实现边听边看，先看后听，对屏幕较小的嵌入式电
子设备有很高的实用意义。
灵活的状态控制功能。允许上层应用随时暂停或停止合成，为用户提供了更大的控
制能力。
支持多种汉字编码方式：包括GB2312\GBK\BIG5\Unicode 等。
2.8. 可靠的开发支持
ejTTS 嵌入式语音合成系统开发接口简洁，易用，且功能强大；
ejTTS 嵌入式语音合成系统的SDK 开发包中，提供了详细的说明文档和演示程序；

3.1. 技术指标
表1 ejTTS 6.0 整体指标
项目指标
文本类型书面文本
文本标注不支持
字符集支持GB_2312，GBK，BIG5, UNICODE
语种中文普通话、英语、粤语
领域库导航版、手机版
中英文混读支持
多音字识别支持普通多音字和姓名多音字的智能处理
阿拉伯数字和特殊符号识别根据上下文自动智能处理
用户自定义词库不支持
发音人
普通话女声：ZhangNan、LiRan 、XiaoKun、
ZhaQian
普通话男声：BaiSong
普通话童声：XiXi
粤语女声：ShuYi
英语女声：Sela、Cameal、LiRan、ZhangNan
英语男声：Barron、Jacky、Kalen、Robby
发音风格字正腔圆、原汁原味、平铺直叙、抑扬顿挫
音频输出格式 WAV 8K/16K/11K/22K/44K 16Bit，VOX，a/uLaw
语速调整支持
音高调整支持
音量调整支持
输入模式支持缓冲区输入和流式回调输入
处理进度通知支持
同步回显支持
回显拼音支持

posted @ 2012-06-22 17:54 nsoft 阅读(1896) 评论(1) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

WINCE TTS语音合成引擎SDK

公告