语音技术带来的表单查询交互改进
语音形式分层
命令
每下达一次命令,就相当于触发一次事件。
如何提高语音命令
转化文字
的准确性?
-
提供上下文
例如:表单重置
就比重置
的识别率高。 -
提前打标
例如:把同志,通知,通吃都当做重置。 -
机器学习改进
例如:发音在谐音库范围内,统统识别成重置。 -
消除环境噪音
例如重置的,重置嘿。
方法一:
不用笔记本内置麦克风,用耳麦。
方法二:
通过(文本编辑距离/文字个数)函数,设定一个临界值。
其中0算是匹配OK。除0外,值越靠近1匹配越精确。
一句话
命令
能触发事件,调用方法。
一句话
则不仅能调用方法,还能传参。
例如:查询工号007的薪资
。
经分析,查询薪资
是用户意图;工号007
是参数。
然后调用预设的方法,输出结果即可。
怎么分析呢?
使用依存句法分析
。
依存句法分析
通过分析语言单位内成分之间的依存关系揭示其句法结构。
直观来讲依存句法分析
识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。
例如:
依存句法分析标注关系 (共15种) 及含义如下:
实际使用存在的问题:
环境噪音和个人说话习惯。
即语音输出的文字,不是一个完整结构的句子。
这会导致句法分析结果错误。
改进方法:
还是得靠提前打标 和 机器学习改进,把结构不完整的句子 自动修复成 完整结构句子。
对话问答
有了能传参、能调用方法的一句话
,我们还需要引导。
例如:查询
。
你可以查询员工薪资
,还可以查询员工基本信息
。
查询员工薪资
。
你可以通过工号查具体某人,也可查某部门下所有员工。
你可以说查询工号007的薪资
,也可以说查询信息平台的员工薪资
。
对话的沟通细节很多,关键在于构建对话流程。
以后会出现面向对话编程
。
语音交互对报表网页的改进
- 快速填写部分表单域。
- 快速完成简单查询功能。
- 快速进行表单新增操作。
- 国际化句子的本地化比网页中的单词本地化更自然。
- 当前的视觉交互可能会作为语音交互的辅助。
合乎自然而生生不息。。。