第一章 绪论
一些说明
本系列是对马耀、汤继良老师《图深度学习》的一个学习记录和整理。由于作者录制了本书的配套视频,且视频讲解顺序与书有细微差别,因此本系列编排顺序与视频一致,但是内容同时参考书籍以及视频。
由于本系列是对《图神经网络》的学习记录和总结,因此只记录关键知识、直观理解以及必要的数学推导,一些严谨的数学定义可能适当忽略。
讲解图神经网络的书籍较多,我将按照书籍内容分别整理,这些内容将会陆续出现在“啃书-图网络”目录下。但是我们在学习的过程中,更应该自成体系,由于不同人有不同的梳理方式,并且为了避免文章的重复,我将不会把自己梳理的体系整理到博客。
简介
- 图深度学习的动机
- 本书内容
- 图特征学习的发展史
图深度学习的动机
- 为什么将数据表示成图?
- 图提供了数据的通用表示形式,来自各个领域的系统的数据可以直接表示成图。
- 很多现实问题可以通过图上的计算任务解决,比如:
- 边的预测:朋友推荐、知识图谱补全,药物相互作用预测
- 节点分类:用户分类、交通预测、空气质量预测
- 图分类:药物特性预测、蛋白质特性预测、大脑网络分析
- 图上的节点是自然向量的,这表明节点不是独立的。而传统机器学习方法通常假设数据是独立同分布的。解决这个问题的思路主要有两种(以节点分类为例):
- 建立一个特定于图的新机制,这种针对图设计的分类问题称为集体分类问题。对于节点来说,不仅要考虑其特征与其标签之间的映射,而且还考虑其邻域相应的映射。
- 构建一组特征来表示其节点,在该表示上可以应用传统分类技术。(主导地位)
- 在图上进行深度学习面临的挑战:
- 节点的邻居可以是任意数量
- 拓扑结构更为复杂
- 节点没有固定的顺序
本书内容
- 理论基础
- 图论基础:图的矩阵表示、图的性质、复杂图
- 深度学习基础:前馈神经网络、卷积神经网络、循环神经网络、自编码器
- 网络嵌入
- 简单图上的图嵌入:保留节点共现、保留结构角色、保留节点状态、保留社区结构
- 复杂图上的图嵌入:异质图、二分图、多维图、符号图。。。
- 图神经网络
- 图滤波:基于谱的图滤波、基于空间的图滤波
- 图池化:平面图池化、层次图池化
- 图神经网络的鲁棒性与可拓展性
- 鲁棒性
- 图对抗攻击:白盒攻击、灰盒攻击、黑盒攻击
- 图对抗防御:对抗训练、图净化、图注意力机制、图结构学习
- 可拓展性:逐点采样法、逐层采样法、子图采样法
- 其他图上的深度学习模型
- 图上的变分编码器、图上的对抗生成网络、Tree-LSTM。。。
- 图深度学习的应用(上)
- 自然语言
- 数据挖掘
- 推荐系统
- 图深度学习的应用(下)
- 计算机视觉
- 生物医疗
- 图深度学习的研究前沿
- 可表达性
- 更深的图神经网络
- 过平滑问题:Jumping Knowledge,DropEdge,PairNorm
- 图上的自监督学习
- 图的结构、节点属性、图结构和节点属性
- 可解释性:样本级的可解释性、模型级的可解释性
- 一些新的应用:图上的组合优化、程序的表达、动态系统
图特征学习的简要发展史
得到节点的表示形式的两种方法:特征工程和特征学习
- 特征工程依赖于手工设计的特征,如:节点度的统计信息
- 特征学习是自动学习节点特征。可以将技术粗略划分为:图特征选择,以移除节点上的无关和冗余的特征;图表示学习,目标是生成一组新的节点特征
图特征选择
自动选择一小部分特征,这些子集具有最小的冗余度,但与学习目标有最大相关性。
图表示学习
- 早期阶段:谱聚类、基于图的降维、矩阵分解
- 谱聚类:将节点嵌入到低维空间,然后在使用传统聚类算法
- 降维:IsoMap、LLE、eigenmap
- 矩阵分解:将节点嵌入低维空间,在该空间中可以利用新的节点表示重建邻接矩阵,如:LSI使用SVD学习文档和单词的表示形式、推荐系统
- 网络嵌入,受到了Word2Vec的启发,DeepWalk迈出第一步,后面有三个主要方向
- 保存节点共现
- 保存其他类型的信息:节点的结构角色、社区信息、节点状态
- 设计复杂图的嵌入框架
- 图深度学习:空间方法和谱方法