UNIT对话系统（杂记）

单轮对话指标：

　　召回率=机器人能回答的问题数/问题总数

　　准确率=机器人正确回答的问题数/问题总数

　　问题解决率=机器成功解决的问题数/问题总数

多轮对话指标：

　　任务完成率=成功结束的多轮会话数/多轮会话总数

格里斯准则：

　　质量准则：只说确认的真实的内容

　　数量准则：所说的话需要满足交流所需要的信息量，但不应该超出交流所需的信息量

　　相关法则：只说和主题相关的内容

　　态度准则：即说话需清晰明了，避免模棱两可

UNIT专业术语

BOT：

　　一个BOT对应一个特定场景下独立的对话系统，用来满足特定场景下的对话理解与交互需求。通常按行业垂类划分。

技能：

　　某一方向的对话能力，分为自定义技能和系统技能。

自定义技能：完全由用户配置
系统技能：UNIT平台预置的通用能力，支持开发者后期干预。

　　技能下包含对话意图与问答意图，即BOT拥有的技能既可以解析用户对话的对话意图，也可以实现简单的FAQ问答。

意图：

　　在一个对话任务中BOT要理解的用户目的。

　　意图分为对话意图和问答意图。问答意图用于圈定某一范围或主题的问答对。

词槽：

　　满足用户对话意图的关键信息或限定条件，可以理解为用户需要提供的筛选条件。词槽一定程度上影响系统对“【动作】”这个对话意图的执行。

　　词典：属于词槽的所有词汇组成词典。

对话样本：

　　用来给对话系统做示范，教它在用户说的具体句子里，该如何理解对话意图，哪个词是重要信息，对应词槽是什么。

对话模板：

　　用来给对话系统按具体语法、句式做出示范，教他在某一特定语法、句式中，该如何理解对话意图，哪个词是重要信息，对应词槽是什么。

　　对话模板也可以使用多条对话模板组成对话模板组，实现按片段去匹配用户query，实现更强的对话意图泛化匹配能力，提高模板对用户query的召回率。

特征词：

　　约束某条对话模板的匹配范围，提供一定限度的泛化能力。

　　活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。

　　特征词词典：开发者需自行导入词典，用于系统识别特征词。

问答对：

问题与答案的组合，称之为问答对。
问答对支持一对一，一对多，多对一，多对多。
当某个问题中包含多个答案，答案随机呈现。

问答集：

问答集是承载问答对的容器，与技能中问答意图的定义一一对应
支持批量将问答内容导入问答集和在线编辑

训练模型：

　　把BOT下所有的配置、标注的对话样本、对话模板等打包提交给UNIT平台来训练对话理解模型，训练的时长跟训练的对话样本量、对话模板量有关系，量越多训练时间越长。训练完成后沙河环境中的BOT会自动加载并生效模型，一般几分钟。

沙盒环境：

　　沙盒环境是UNIT平台提供开发者创建BOT、训练优化BOT模型的环境。

　　每个BOT都配有一个沙盒环境，将训练好的BOT模型生效到沙盒环境后，就可以进行效果验证了，同时可接入到您自己的业务系统中使用。

　　可以生成多个模型版本，但只能选择一个放到沙盒环境中。

生产环境：

　　生产环境是UNIT平台在百度云上为开发者提供的可定制的稳定的对话服务环境。

知识图谱：

　　知识图谱其实就是语义网，描述真实世界中存在的各种实体或概念。它是知识的结构化表示，通常我们用一张巨大的由点和边组成的图来可视化表现知识图谱：点代表实体或概念，用全局唯一确定ID来标识，称为标识符，点包含属性，称为值对（AVP），用来刻画实体的内在特性，边代表实体间的关系，用来连接两个实体。

情感分析：

　　情感分析是指为会话赋予情感值，可根据情感值的正负将情感倾向分为正面情感、中立情感和负面情感。

　　评测情感分析的指标主要为情感分类的准确率及负情感的召回率。

posted @ 2019-12-11 17:10 苏道羲阅读(408) 评论(0) 编辑收藏举报

刷新页面返回顶部

苏道羲