南开小巷

导航

task02:图的基本表示和特征工程

2.1传统图机器学习(人工特征工程+机器学习)

  • 把向量输入机器学习模型中

  • 特征

    • 一个节点自有的特征属于属性特征
    • 连接特征:节点与其他节点的连接关系
  • 数据+特征,机器学习才能效果好

    • 数据是样本,特征就是选取的分类条件(比如聚类分析中,选取鸢尾花的花瓣长度,花瓣宽度,花萼高度,花萼宽度这就是特征,特征选取的好,收敛就快,效果就好)
    • 人的作用是构造出特征,算法会筛选出哪些特征权重高,哪些权重低
    • 特征需要行业背景
  • 本节要对

    • 对节点做特征工程(node):d个向量,d个特征

      • 节点的连接数

      • 节点的重要程度

        • 特征向量节点重要度:如果一个节点,他周围的节点也很重要,那么他自身也很重要

        • 这个betweenness centrality 也比较重要,比如湖北省到达其他省份最多经过两个省

      • 节点的抱团系数(是否形成环)


    • 对连接做特征工程(edge):d个向量,d个特征

    • 对全图做特征工程(graph):d个向量,d个特征

  • 在networkx里graphlet被称之为Atlas

posted on 2023-02-14 23:30  南开小巷  阅读(22)  评论(0编辑  收藏  举报