WINCE TTS语音合成引擎SDK

WINCE 捷通语音合成引擎,成熟稳定,提供例子程序和SDK,提供技术支持。

WINCE  语音合成有下列技术特点:

1,声音清晰(清脆)

2,语速可以调节

3,占用系统资源少,对系统要求少

4,代码占用空间少

5,编程接口方便

6,声音甜美

7,技术成熟可靠

8,支持C++、C#、VB.NET语言编程

9,朗读音量可以调节

WINCE 6.0 TTS语音合成演示测试软件下载

WINCE 5.0 TTS语音合成演示测试软件下载

 技术咨询QQ:1005974096

 



 

1. 概述
进入21 世纪,互联网技术与移动通讯技术的高速发展,使得嵌入式产品在人们生活、
学习、工作中的应用越来越普及,手机、个人数字助理(PDA)等嵌入式产品已成为人们必不
可少的通讯与信息获取工具。同时,为了让人们更方便的使用各种电子设备,摆脱单一晦涩
的人机交互方式,使机器“能听、能看、能说”,应用人类自然形成的交流手段,方便人们
与机器之间的信息交流,这已成为当前嵌入式产品发展的一个重要方向。
智能人机交互技术是指能够实现人与机器之间进行自然交互的手段,其中包括语音合
成、语音识别、手写识别、指纹识别、机器翻译等多项技术。近年来语音合成、语音识别、
手写识别等智能人机交互技术的长足进步,有力地促进了机器进入“能听、能看、能说”的
自然人机交互(NUI)阶段。语音,凭借其自然、灵活、便捷的交互方式,也已成为重要的
人机交互手段。
如今,基于大语料库的语音合成技术已经比较成熟,合成语音自然度较高,可广泛的应

2.1. ejTTS 6.0 特性
支持多种规模的音库,满足各类需求;
支持合成语音的不同采样率、比特率、格式输出;
支持用户定制化需求;
支持多种压缩参数和谱参数引擎;
支持动态音频参数规划;
支持流式文本输入;
支持进度通知;
支持同步回显拼音输出;
全新架构,具有高可靠的稳定性。

2.2. 高品质的语音合成效果
由于采用了新的语音合成算法,ejTTS 在合成效果上已经接近传统大语料库语音合
成算法的效果,与以往的嵌入式语音合成软件相比,合成语音更加自然和流畅。
由于采用了一体化的智能文本分析算法,结合统计和规则等处理手段,ejTTS 的文
本处理前端拥有较强的分词、多音字、韵律环境预测能力,以及自动识别和处理日
期时间、数值金额、电话号码等文本的能力。
针对文本变化范围可事先预知的领域,谱参数引擎可根据用户需求,通过制作定制
音库和优化文本分析的方法,使得合成效果更为准确和自然。
2.3. 极低的资源需求
整体软件架构的设计紧凑高效;
软件开发过程中,在合成算法、数据结构、代码编写等不同层面都进行了深入优化;
资源的结构设计也非常精巧,既降低了资源的尺寸,又提升了资源访问的效率。

2.4. 良好的系统移植性
ejTTS 对不同的硬件和软件环境有极强的适应能力和移植能力,通过对与环境相关
部分的抽象设计,只要极少量的代码修改,即可快速满足不同环境下的需求;
ejTTS 支持多种资源配置方案,既可配置到支持线性访问的Nor Flash 存储器中,
也可配置到分块访问的Nand Flash 中,如果环境支持文件系统,还可以以文件的
方式配置;

2.5. 高度可裁减性
算法可裁减,面对多种环境的提供多种不同复杂度的算法以供选择,相应的对动态
RAM 资源的需求也会有所变化;
尺寸可裁减,对不同的效果要求,资源的尺寸可大可小,具有很大的伸缩性。
2.6. 强大的定制能力
ejTTS 灵活的系统架构,使得功能的任意配置成为可能,用户可以决定是否采用或
者去除某个处理算法或模块;
ejTTS 针对多种行业进行了语音合成算法优化和定制音库的服务。捷通华声公司拥
有专门的数据定制小组负责定制内容服务,按照用户的需求,录制和制作语音合成
定制音库,可在极短的时间内满足用户的定制需求。
2.7. 丰富的控制接口
根据捷通公司在嵌入式领域多年的开发经验,我们为调用语音合成模块的用户提供了许
多方便体贴的接口,以满足用户不同的需求。
实时的对合成进度的反馈。在文本的合成过程中,实时通知上层应用文本的合成信
息:包括当前文本的合成位置、当前所合成文字,以及该字的音素信息(拼音或音
标)等。该功能让上层应用可以实现边听边看,先看后听,对屏幕较小的嵌入式电
子设备有很高的实用意义。
灵活的状态控制功能。允许上层应用随时暂停或停止合成,为用户提供了更大的控
制能力。
支持多种汉字编码方式:包括GB2312\GBK\BIG5\Unicode 等。
2.8. 可靠的开发支持
ejTTS 嵌入式语音合成系统开发接口简洁,易用,且功能强大;
ejTTS 嵌入式语音合成系统的SDK 开发包中,提供了详细的说明文档和演示程序;

3.1. 技术指标
表1 ejTTS 6.0 整体指标
项 目 指 标
文本类型 书面文本
文本标注 不支持
字符集 支持GB_2312,GBK,BIG5, UNICODE
语种 中文普通话、英语、粤语
领域库 导航版、手机版
中英文混读 支持
多音字识别 支持普通多音字和姓名多音字的智能处理
阿拉伯数字和特殊符号识别 根据上下文自动智能处理
用户自定义词库 不支持
发音人
普通话女声:ZhangNan、LiRan 、XiaoKun、
ZhaQian
普通话男声:BaiSong
普通话童声:XiXi
粤语女声:ShuYi
英语女声:Sela、Cameal、LiRan、ZhangNan
英语男声:Barron、Jacky、Kalen、Robby
发音风格 字正腔圆、原汁原味、平铺直叙、抑扬顿挫
音频输出格式 WAV 8K/16K/11K/22K/44K 16Bit,VOX,a/uLaw
语速调整 支持
音高调整 支持
音量调整 支持
输入模式 支持缓冲区输入和流式回调输入
处理进度通知 支持
同步回显 支持
回显拼音 支持

posted @ 2012-06-22 17:54  nsoft  阅读(1896)  评论(1编辑  收藏  举报