task02:图的基本表示和特征工程
2.1传统图机器学习(人工特征工程+机器学习)
-
把向量输入机器学习模型中
-
特征
- 一个节点自有的特征属于属性特征
- 连接特征:节点与其他节点的连接关系
-
数据+特征,机器学习才能效果好
- 数据是样本,特征就是选取的分类条件(比如聚类分析中,选取鸢尾花的花瓣长度,花瓣宽度,花萼高度,花萼宽度这就是特征,特征选取的好,收敛就快,效果就好)
- 人的作用是构造出特征,算法会筛选出哪些特征权重高,哪些权重低
- 特征需要行业背景
-
本节要对
-
对节点做特征工程(node):d个向量,d个特征
-
节点的连接数
-
节点的重要程度
- 特征向量节点重要度:如果一个节点,他周围的节点也很重要,那么他自身也很重要
- 这个betweenness centrality 也比较重要,比如湖北省到达其他省份最多经过两个省
-
节点的抱团系数(是否形成环)
-
-
对连接做特征工程(edge):d个向量,d个特征
-
对全图做特征工程(graph):d个向量,d个特征
-
-
在networkx里graphlet被称之为Atlas