图数据挖掘:网络的常见度量属性
1 度分布
网络的度分布表示了一个随机选择的节点拥有度的概率。我们设度为的节点数目,除以节点数量则可得到归一化后的概率质量分布:
我们有:。
对于下面这个网络:

其归一化后的度分布直方图可表示如下:

2 路径
2.1 图的路径
图的路径(path)指一个节点序列,使得序列中的每个节点都链接到序列中的下一个节点(注意:这里的术语不同教材不一样,有的教材把这里的路径定义为漫游(walk),而将术语“路径”保留给简单路径)。路径可以用以下方式进行表示:
一个路径可以通过经过同一条边多次而和它自身相交。如下面这个图中更多路径ABDCDEG就和自身相交。

注意,在有向图中路径只能沿着边的方向。
2.2 路径的条数
路径的条数定义为节点和之间的路径数量。我们发现邻接矩阵的幂和路径的条数之间有着关系。
- 长度 (这里的h可理解为跳数hops)的路径计数矩阵: 只需要考察和之间是否存在长度为的链接,即
- 长度 的路径计数矩阵: 需要考察和之间是否存在长度为的路径,即对满足的进行计数。
- 长度 的路径计数矩阵: 需要考察和之间是否存在长度为的路径,即对满足的所有序列进行计数。
上述结论对有向图和无向图都成立。上述定理解释了如果和之间存在最短路径,那么它的长度就是使非零的最小的。
进一步推论可知,在一个个节点的图中找到所有最短路径的一个简单方法是一个接一个地对图的邻接矩阵做连续的幂计算,知道第次,观察使得每一个元素首次变为正值的幂计算。这个思想在Folyd-Warshall最短路径算法中有着重要应用应用。
2.3 距离
图中两个节点之间的距离(distance)定义为两个点最短路径中的边数(如果两个点没有连通,距离通常定义为无穷大)。
如对下面这个图我们有、之间的距离,、之间的距离。

注意,在有向图中距离必须沿着边的方向。这导致有向图中的距离不具有对称性。比如下面这个图中我们就有。

我们定义两两节点之间距离的最大值为图的直径(diameter)。
2.4 平均路径长度
无向连通图(连通分量)或有向强连通图(强连通分量)的平均路径长度(average path length)定义为:
这里是节点到的距离。,这里中的系数可要可不要,不同教材定义方法不一样。
在计算平均路径长度时,我们通常只计算连通节点之间的距离(也即忽略长度为“无穷”的路径)
2.5 寻找最短路径
对于无权图,我们可以由宽度优先搜索(BFS)搜寻图的最短路径。
- 从节点开始,将其标注为,并将其加入队列。
- 当队列不为空时:
- 将队首元素移出队列,将其未标注的邻居加入队列并标注为。
- 循环往复。

对于带权图,我们当然就得寻求Dijkstra、Bellman-Ford等算法啦,此处不再赘述.
3 节点中心性
节点的中心性(centrality)可以用于度量节点的重要程度。节点的中心性有许多种类,下面我们介绍介数中心性(betweeness centrality)和接近中心性(closeness centrality)。
3.1 介数中心性
介数中心性基于这样一个思想:如果一个节点在许多其它节点之间的最短路径上,那么这个节点就是重要的。于是我们可以将节点的介数中心性定义为:
以下面这个图为例:
3.2 接近中心性
接近中心性基于这样一个思想:如果一个节点到其它所有节点的最短路径长度都很小,那么这个节点就是重要的。于是我们可以将节点的接近中心性定义为:
还是以上面那个图为例,在该图中有:
4 聚类系数
节点的聚类系数(clustering coefficient)可以直观地理解为节点的邻居有多大比例是互相连接的。设节点的度为,则其聚类系数定义为
这里为节点邻居之间的边数,我们有。下面展示了聚类系数的一些实例:

图的平均聚类系数(average clustering coefficient)定义为:
5 真实世界网络的属性
接下来我们来看一MSN收发信息网络(有向)的实例。

该网络中245 million用户注册,180 million用户参与了聊天,拥有超过30 billion个回话。超过 255 billion条交互信息。
连通性

度分布
其度分布高度倾斜,平均度为。
log-log度分布

聚类系数
这里为了方便出图,我们定义横坐标为度,对应的纵坐标为度为的节点的聚类系数的平均值,即。

整个网络的平均聚类系数为。
距离分布

其中平均路径长度为,的节点可以在跳之内到达。
参考
[1] http://web.stanford.edu/class/cs224w/
[2] Easley D, Kleinberg J. Networks, crowds, and markets: Reasoning about a highly connected world[M]. Cambridge university press, 2010.
[3] Barabási A L. Network science[J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2013, 371(1987): 20120375.
[4] 《图论概念梳理》
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· spring官宣接入deepseek,真的太香了~