14-influence 图机器学习之网络的影响力最大化
网络的影响力最大化
与陌生人相比,我们更容易受到朋友的影响
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232118034-1535667729.png)
病毒性营销
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232118461-1004070445.png)
凯特王妃的影响力
凯特穿过的衣服容易脱销
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232118874-1600851491.png)
那么,如何发现类似于凯特这一号人物的类似节点?
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232119424-1449684082.png)
影响力最大化
给定一个有向图,找到k个影响力最大的种子
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232119908-2026816080.png)
两个经典的传播模型
线性阈值模型
独立级联模型
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232120260-886627414.png)
首先来看线性阈值模型
节点v有随机的阈值 0到1
节点v受邻居w的影响,影响范围为b_v,w
当节点受影响的权重和大于某个阈值时,被激活
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232120598-1746732545.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232120890-616167323.png)
概率传播
独立级联模型
有向图
每条边(v,w)有一个属性是概率p_vw,表示,若v是激活的,那么,他使w激活的概率为p_vw
每条边最多只能触发一次
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232121193-199188188.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232121773-523939029.png)
f(s): 最终活跃的集合
f(s)越大,S越具影响力
影响力最大化的难题
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232122830-753606259.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232123131-2145542059.png)
近似算法:
不需要找到全局最优的解决方案
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232123452-697662177.png)
近似算法:贪心爬升算法
输入:收到影响的集合Xu,内含若干节点{v1,v2,..}
算法:每一次迭代,激活节点u后,带来的最大激活增益
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232123780-1463642759.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232124095-1757679373.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232124496-769626965.png)
计划:证明两件事情:f(s)是子模块? ;算法给了一个近似优化的解决方案
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232125460-1291324184.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232125847-1172199629.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232126181-415210161.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232126565-1873678728.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232126973-1614016448.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232127333-72066791.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232127740-1637730005.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232128175-1901515811.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232128544-1921333797.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232128842-2081793335.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232129186-1978464149.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232129482-664456608.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232129829-2099235395.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232130206-258277527.png)
时间以及总结思考
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232130483-1153776161.png)
实验数据:共同协作写论文的网络,来源 arXiv
级联过程示例:新科技方法/研究领域的传播
独立级联模型
每个用户的阈值归一化到[0,1]
case1:每个边都一个统一的概率p
case2:每个边(v,w)激活w的概率p等于1/deg(w)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232130794-1947939490.png)
与3个结果进行比较:度中心性;紧密中心性;随机节点
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232131156-1167944848.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232131821-202998514.png)
加速:基于骨架的算法
为了计算影响力最大化,我们需要
1) 生成R个可能的世界
2) 识别K个具有影响力的节点
时间复杂度为O(m) m为边的数目
基于骨架的算法,可将复杂度缩至O(1)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232132160-1107752951.png)
计算每个节点的小架构来评估影响力
再使用计算结果计算影响力最大化
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232132512-1418324887.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232132811-393186881.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232133113-840986842.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232133445-1766340689.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232133818-474310710.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232134198-236426293.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232134558-2024160474.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232134971-16238118.png)
![](https://img2018.cnblogs.com/blog/985935/202002/985935-20200206232135938-2143566173.png)