肖仰华 | SIGIR 2018——WWW2018 知识图谱研究综述
肖仰华 | SIGIR 2018——WWW2018 知识图谱研究综述
提纲
智能时代
催生智能应用
需要认知智能
依赖知识图谱
计算智能 、 感知智能 、 认知智能
认知智能
数据红利的消耗殆尽,以深度学习为代表的感知智能遇到天花板
徐宗本院士“数据不够模型补”;作者:“数据不够知识补” -> “数据足够了,知识也不能缺失”
认知智能的应用需求
-
精确分析
精准化
数据分析:
舆情分析、热点分析、军事情报分析、商业情报分析;精细化
数据分析:
酒店评论抽取、个性化制造
-
智慧搜索
- 精准搜索
意图理解
:
精准分类、语义理解、个性化
难题
例子:搜索“toys kids”或者“kids toys” - 复杂
多元
对象搜索:
表格、文本、图片、视频、文案、素材、代码、专家 - 多粒度搜索
篇章级、段落级、语句级 - 跨媒体搜索
不同媒体数据联合完成搜索任务
- 精准搜索
-
智能推荐
- 场景化推荐
历史记录,消费意图 - 任务型推荐
特定任务 - 冷启动环境下推荐
传统推荐是基于统计信息;如何利用外部知识解决 - 跨领域推荐
跨领域背景知识 - 知识型推荐
相关知识推荐,关乎信任与接收度
推荐趋势:精准感知任务与场景,想用户之未想
- 场景化推荐
-
智能解释
事实解释、关系解析、过程解释、结果解释
可解释
是智能系统决策结果
被采信的前提 -
人机交互
一切皆可问答
-
深层关系推理
深层关系发现与推理能力
知识图谱
知识图谱是实现机器智能的使能器(Enabler)
知识图谱 作为一种语义网络
是 大数据时代知识表示
知识图谱 作为一种技术体系
是 大数据时代的知识工程
知识规模上的量变带来了知识效用的质变
知识工程
到了上世纪八十年代之后就销声匿迹了。根本原因在于传统知识库构建主要依靠人工构建、代价高昂、规模有限。
互联网应用的特点:
- 规模巨大
- 精度要求相对不高
- 简单知识推理
知识是普遍关联的
,当然关联也是有条件的;领域知识的领域性通常是个伪命题
领域知识库的深度应用势必涉及通用知识库
通用知识库
的研究是在抢占知识库研究的战略制高点,对于领域知识库
能够形成战略俯冲。
简单的公式表明传统知识工程
与以知识图谱为代表的新一代知识工程
的联系与区别:Small knowledge + Bigdata=Big knowledge
本质是建立起从数据到知识库中的知识要素(包括实体、概念和关系)映射的一个过程
机器理解自然语言需要类似知识图谱这样的背景知识
NLP + KB = NLU
NLU(natural language understanding)
知识图谱让可解释人工智能
成为可能
可解释性
是不能回避符号知识
的
可解释推荐
将是未来推荐研究的重要领域,将是具有巨大商业价值的研究课题
数据驱动
转变为知识驱动
;ML + KB = ML^2
总结:
Small knowledge + Bigdata=Big knowledge
NLP + KB = NLU
NLU(natural language understanding)
ML + KB = ML^2