UNIT对话系统(杂记)

单轮对话指标:

  召回率=机器人能回答的问题数/问题总数

  准确率=机器人正确回答的问题数/问题总数

  问题解决率=机器成功解决的问题数/问题总数

多轮对话指标:

  任务完成率=成功结束的多轮会话数/多轮会话总数

格里斯准则:

  质量准则:只说确认的真实的内容

  数量准则:所说的话需要满足交流所需要的信息量,但不应该超出交流所需的信息量

  相关法则:只说和主题相关的内容

  态度准则:即说话需清晰明了,避免模棱两可

UNIT专业术语

BOT:

  一个BOT对应一个特定场景下独立的对话系统,用来满足特定场景下的对话理解与交互需求。通常按行业垂类划分。

技能:

  某一方向的对话能力,分为自定义技能和系统技能。

  • 自定义技能:完全由用户配置
  • 系统技能:UNIT平台预置的通用能力,支持开发者后期干预。

  技能下包含对话意图与问答意图,即BOT拥有的技能既可以解析用户对话的对话意图,也可以实现简单的FAQ问答。

意图:

  在一个对话任务中BOT要理解的用户目的。

  意图分为对话意图和问答意图。问答意图用于圈定某一范围或主题的问答对。

词槽:

  满足用户对话意图的关键信息或限定条件,可以理解为用户需要提供的筛选条件。词槽一定程度上影响系统对“【动作】”这个对话意图的执行。

  词典:属于词槽的所有词汇组成词典。

对话样本:

  用来给对话系统做示范,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。

对话模板:

  用来给对话系统按具体语法、句式做出示范,教他在某一特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。

  对话模板也可以使用多条对话模板组成对话模板组,实现按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。

特征词:

  约束某条对话模板的匹配范围,提供一定限度的泛化能力。

  活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。

  特征词词典:开发者需自行导入词典,用于系统识别特征词。

问答对:

  • 问题与答案的组合,称之为问答对。
  • 问答对支持一对一,一对多,多对一,多对多。
  • 当某个问题中包含多个答案,答案随机呈现。

问答集:

  • 问答集是承载问答对的容器,与技能中问答意图的定义一一对应
  • 支持批量将问答内容导入问答集和在线编辑

训练模型:

  把BOT下所有的配置、标注的对话样本、对话模板等打包提交给UNIT平台来训练对话理解模型,训练的时长跟训练的对话样本量、对话模板量有关系,量越多训练时间越长。训练完成后沙河环境中的BOT会自动加载并生效模型,一般几分钟。

沙盒环境:

  沙盒环境是UNIT平台提供开发者创建BOT、训练优化BOT模型的环境。

  每个BOT都配有一个沙盒环境,将训练好的BOT模型生效到沙盒环境后,就可以进行效果验证了,同时可接入到您自己的业务系统中使用。

  可以生成多个模型版本,但只能选择一个放到沙盒环境中。

生产环境:

  生产环境是UNIT平台在百度云上为开发者提供的可定制的稳定的对话服务环境。

知识图谱:

  知识图谱其实就是语义网,描述真实世界中存在的各种实体或概念。它是知识的结构化表示,通常我们用一张巨大的由点和边组成的图来可视化表现知识图谱:点代表实体或概念,用全局唯一确定ID来标识,称为标识符,点包含属性,称为值对(AVP),用来刻画实体的内在特性,边代表实体间的关系,用来连接两个实体。

情感分析:

  情感分析是指为会话赋予情感值,可根据情感值的正负将情感倾向分为正面情感、中立情感和负面情感。

  评测情感分析的指标主要为情感分类的准确率及负情感的召回率。

 

 

 

posted @ 2019-12-11 17:10  苏道羲  阅读(408)  评论(0编辑  收藏  举报