UNIT对话系统(杂记)
单轮对话指标:
召回率=机器人能回答的问题数/问题总数
准确率=机器人正确回答的问题数/问题总数
问题解决率=机器成功解决的问题数/问题总数
多轮对话指标:
任务完成率=成功结束的多轮会话数/多轮会话总数
格里斯准则:
质量准则:只说确认的真实的内容
数量准则:所说的话需要满足交流所需要的信息量,但不应该超出交流所需的信息量
相关法则:只说和主题相关的内容
态度准则:即说话需清晰明了,避免模棱两可
UNIT专业术语
BOT:
一个BOT对应一个特定场景下独立的对话系统,用来满足特定场景下的对话理解与交互需求。通常按行业垂类划分。
技能:
某一方向的对话能力,分为自定义技能和系统技能。
- 自定义技能:完全由用户配置
- 系统技能:UNIT平台预置的通用能力,支持开发者后期干预。
技能下包含对话意图与问答意图,即BOT拥有的技能既可以解析用户对话的对话意图,也可以实现简单的FAQ问答。
意图:
在一个对话任务中BOT要理解的用户目的。
意图分为对话意图和问答意图。问答意图用于圈定某一范围或主题的问答对。
词槽:
满足用户对话意图的关键信息或限定条件,可以理解为用户需要提供的筛选条件。词槽一定程度上影响系统对“【动作】”这个对话意图的执行。
词典:属于词槽的所有词汇组成词典。
对话样本:
用来给对话系统做示范,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。
对话模板:
用来给对话系统按具体语法、句式做出示范,教他在某一特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。
对话模板也可以使用多条对话模板组成对话模板组,实现按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。
特征词:
约束某条对话模板的匹配范围,提供一定限度的泛化能力。
活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。
特征词词典:开发者需自行导入词典,用于系统识别特征词。
问答对:
- 问题与答案的组合,称之为问答对。
- 问答对支持一对一,一对多,多对一,多对多。
- 当某个问题中包含多个答案,答案随机呈现。
问答集:
- 问答集是承载问答对的容器,与技能中问答意图的定义一一对应
- 支持批量将问答内容导入问答集和在线编辑
训练模型:
把BOT下所有的配置、标注的对话样本、对话模板等打包提交给UNIT平台来训练对话理解模型,训练的时长跟训练的对话样本量、对话模板量有关系,量越多训练时间越长。训练完成后沙河环境中的BOT会自动加载并生效模型,一般几分钟。
沙盒环境:
沙盒环境是UNIT平台提供开发者创建BOT、训练优化BOT模型的环境。
每个BOT都配有一个沙盒环境,将训练好的BOT模型生效到沙盒环境后,就可以进行效果验证了,同时可接入到您自己的业务系统中使用。
可以生成多个模型版本,但只能选择一个放到沙盒环境中。
生产环境:
生产环境是UNIT平台在百度云上为开发者提供的可定制的稳定的对话服务环境。
知识图谱:
知识图谱其实就是语义网,描述真实世界中存在的各种实体或概念。它是知识的结构化表示,通常我们用一张巨大的由点和边组成的图来可视化表现知识图谱:点代表实体或概念,用全局唯一确定ID来标识,称为标识符,点包含属性,称为值对(AVP),用来刻画实体的内在特性,边代表实体间的关系,用来连接两个实体。
情感分析:
情感分析是指为会话赋予情感值,可根据情感值的正负将情感倾向分为正面情感、中立情感和负面情感。
评测情感分析的指标主要为情感分类的准确率及负情感的召回率。