华为机器学习服务语音识别功能,让应用绘“声”绘色
随着人们对生活的仪式感的追求,移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统也变得越来越流行。在这些应用上,鼠标、键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互、驾驶模式等。因此,App里集成语音识别功能不仅能解放双手,也能得到很好的人机交互体验。
1. 业务简介
HMS Core机器学习服务实时语音识别服务支持将实时输入的短语音(时长不超过60秒)转换为文本,可实时识别60秒内的语音。该服务使用行业领先的深度学习技术,随着算法和数据的不断迭代,目前在通用理想环境下的识别准确率可达95%以上。目前支持中文普通话(包括中英文混说)、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语、菲律宾语的识别。
DEMO演示
2 . 场景介绍
HMS Core机器学习服务实时语音识别服务覆盖日常生活及工作中的众多领域,并且深度优化了购物搜索、影视搜索、音乐搜索以及导航等场景中的识别能力,进一步提高这几类场景的识别准确率。在使用购物类App搜索商品时,可以将语音描述的商品名称或特征识别为文字从而搜索到目标商品。同样,在使用音乐类App时,可以将语音输入的歌名或歌手识别为文字进而搜索歌曲。另外,司机在驾驶过程中不方便输入文字时,可以将输入的语音转换为文字继而搜索目的地,让行车更加安全。
3 . 功能特点
• 支持实时出字
• 提供拾音界面、无拾音界面两种方式
• 支持端点检测,可准确定位开始和结束点
• 支持静音检测,语音中未说话部分不发送语音包
• 支持数字格式的智能转换,例如语音输入“二零二零年”时,能够智能识别为“2020年”。
如何接入华为机器学习服务?
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~