对中文版“Siri”打个招呼吧!

“雨点”,又名“中文Siri”,中国任何有手机的人都能够使用。

你可能没听说过科大讯飞(iFlyTek)。这家公司在中国国内市场上几乎也并非家喻户晓。但它却牢牢占据中国语音识别技术市场份额的80%以上,公司开发的生态系统有超过10000名合作伙伴和开发者,用户数以亿计。

 
该公司于1999年由中国科学技术大学的学生刘庆峰和其他五名同学创立,该校被广泛认为是中国最出色的研究机构之一。公司的创始人们利用了学校的国家智能计算机研发中心和人机语音交流实验室的研究成果。
 
科大讯飞开发出了一系列的文本-语音转换(TTS)产品,最近还开发出语音识别和基于云的语音技术平台,名为“语音云”。过去几年里,识别准确率稳步提高,该技术也应用在了前所未有的广泛的产品上。
 
公司的“语音云”平台支持语音识别、语音合成和语音输入应用程序。今年3月,公司开发出语音理解功能,以及被称为中文版Siri的“雨点”,只要有一台能上网的手机就能使用。
 
IHS iSuppli的一位分析师伊安•弗格(Ian Fogg)表示,语音技术的市场仍然相当不成熟,但是谷歌和Nuance这样的服务商近年来已经利用云的力量来处理语音询问,取得了重大进展。他说:“旧模式就是像龙自然语音(Dragon Naturally Speaking)那样的应用程序,但其缺点是,你必须得训练它来适应你的声音。”
 
刘庆峰承认,科大讯飞与谷歌、Nuance公司使用的是“同样的核心技术”,但他宣称,公司的开放平台和中国本土的专业技术让公司的产品比美国的强。
 
他说,随着用户数量由2011年上半年的100万增加至现在的1亿,语音云平台的识别准确性已经变得更高。
 
刘庆峰表示:“在中文和中国市场方面,我们和其他竞争对手相比处于更明显的优势地位,因为我们有更大的语音数据,每天有1亿语音云的用户在更新这一数据库。”
 
因为中文语调本身的特点,要对中文语音实现正确识别和合成格外困难。也就是说,相同的单词根据说话语调的不同,可以表示不同的意思。比如广东话的“gau”就有好几种意思,其中包括“九”和“狗”。
 
公司研发经理胡玉(音)表示,出于这个原因,科大讯飞开发了一套“双源模型系统”,将语调信息和声谱分离,来提高辨识准确率。公司还宣称拥有创新的系统,甚至能够在嘈杂的环境下,甚至是被干扰的频道上识别出语音。
 
刘庆峰认为,科大讯飞成功的关键之一在于,愿意和公司之外的研究机构合作,这些机构包括中国科学技术大学、清华大学和中国社会科学院语言研究所等。
 
他说:“语音技术是个典型的跨学科项目,包括不同的学科,比如计算机科学、声学、语音学和语言学等。在国家科技部的支持下,我们建立了语音与语言信息处理国家工程实验室,这是语音语言领域唯一一座国家级实验室。”
 
最终,公司的10000个合作伙伴和开发者构成的广大网络确保了该技术能在范围广大的一系列设备、频道和应用程序上使用。世界最大的网络运营商中国移动最近收购了公司15%的股份,进一步扩展了公司的业务范围。
 
他表示,这些合作关系也让和Siri相似的“雨点”用“丰富的信息资源”,包括娱乐、旅游和票务信息等资源来为其用户群提供更好的服务。
 
也许在不久之后,公司的技术就会在中国以外的市场上占据统治地位。对于那些对土生土长的中国公司能否玩转英语语言技术的怀疑之声,刘庆峰迅速道出了科大讯飞技术所获奖项的清单。
 
公司自2006年至2012年连续7年获暴雪英语文本-语音转换国际挑战赛冠军,2008年至2010年获美国国家标准与技术研究院(NIST)语音识别评估第一名,2009年和2010年获美国国家标准与技术研究院语言识别评估第一名。刘庆峰说,公司也已“成功完成”了对其他几种语言的研发工作,包括日语、韩语、法语、西班牙语和俄语。
 
中国现已成为世界最大的智能手机市场,公司显然有巨大的发展潜力。
 
不过Ovum的首席分析师丹尼尔•洪(Daniel Hong)表示,科大讯飞“似乎把注意力集中在相当大的、仍有很大发展空间的垄断市场上。”HIS分析师弗格也认为,完全着眼于中国市场的规模,可能在短期内让公司分心。
 
总部位于北京的技术咨询公司迈博瑞咨询(Marbridge Consulting)创始人马克•奈金(Mark Natkin)则更为乐观。他说:“我认为如果科大讯飞能够利用中国市场独有的特点,获得发展动力,那么现有的发展势头常常能转化为海外扩张中的盈利增长。”
 
ABI Research的高级分析师迈克尔•摩根 (Michael Morgan)表示,科大讯飞通过着眼于中国市场,目前成功规避了像与Nuance类似产品所面对的与知识产权相关的法律纠纷。“从长期来看,科大讯飞能够利用其本土语言技术,与本国的手持设备代工厂商建立合作关系,从而打造出足以进军全球市场的业务。”摩根说。
 
公司目前已经与华为、中兴和联想建立了合作关系,随着这些手持设备制造商将发展的眼光投向国外,科大讯飞迈向全球市场的步伐可能比预想中要快。
 
咨询公司Gartner认为,到2020年,在50%的网页和移动客户服务互动中,语音将成为人和计算机交流的渠道。
posted @ 2013-07-10 14:25  jessonlv  阅读(401)  评论(0编辑  收藏  举报