13-contagion 图机器学习之疾病的概率传染

概率传播

简单的模型：

第一波：一个携带病毒的人进入人群，与他接触的人有概率q被感染，他接触了d个人，d中一部分将会被干扰

第二波：d人活动，会见d个人，开始传播

后续：上述重复

基于随机树的传播

那么，当d和q等于什么值的时候，传染病会永久传播？

Ph 节点a在第h层被感染的概率

具体公式如下：

x 节点a在第h-1层被感染的概率，从x=1开始，因为p1=1

f(x) 节点a在第h层被感染的概率

q 感染概率

d 度

若想传染病灭绝，那个f(x)的曲线必须在y=x之下

f（x）的导数是单调

R0=q*d=受感染人数的期望在传染人数

当R0>=1时，成为传染病

当R0>=1时，成为传染病

当<1时，疾病灭绝

抑制扩散的措施

改变q或d

减少d：隔离人

减少q：鼓励更好的卫生习惯用于较少疾病传播

HIV的R0在2到5之间

Measles的在12到18

Ebola的在1.5到2

应用：Flickr的级联和真实疾病的R0评估

首先来看Flickr的

在Flickr的社交网络中，用户与其他用户通过成为好友相连，一个用户可以点赞一个图片

数据：

100天的照片点赞

用户数量：两百万

点赞数：34734221

照片数：11267320

Flickr中的级联

一个用户在他至少一个好友点赞一个照片后也点赞该照片

从真实数据中计算R0

首先计算q

然后根据公式计算R0

此处有两个R0，评估的R0通过公式计算而得，经验主义的R0通过数直接相连的节点的被传染的数量

在Flickr中，R0在1到190，比很多传染病的都要高，这说明，信息在社交网络中的传播非常迅速

传染病模型

病毒传播设计的两个参数：

被感染概率：β

被治愈概率：δ

更普遍的：S+E+I+R模型

传播模型受以下参数控制

S:易感人群

E:暴露人群

I:受感染

R:痊愈

Z:免疫者

SIR模型

需要注意的一点：当一个感染者被治愈后，就不会再被感染

假设网络是一个完全图，模型的动力学相关的公式如下：

SIS模型

治愈的节点会被重复感染

参数：病毒力量 s=β/δ

传播阈值t 当s<t时，病毒可以灭绝

给定一个网络，那么，他的阈值是？

阈值为邻接矩阵的最大特征值

初始感染人数对于最终的传播结果重要吗？

埃博拉的模型：

S:易感人群

E:暴露人群

I:受感染

Z:免疫者

H：住院病例

F:死亡但没有被掩埋

R:不传播该疾病的个体

使用SEIZ模型模拟谣言传播

S: 易感人群→twitter的用户

I: 受感染者→相信谣言的人，发了相关的tweet

E：暴露者→看到谣言但未相信的人群

Z：怀疑者→怀疑，未发布相关的消息

数据集：收集了4个故事，其中4真4假

将数据应用到SEIZ模型

tweet(t)=谣言的tweet数

I（t）=模型评估的谣言tweet

使用网格搜索发现最优参数

谣言的Rsi值较小

独立的级联网络

初始化一些节点是毁约的，每条边有一个概率权重

当一个节点被感染的时候，传染给邻居的概率为p_uv

从暴露到采用

从两个曲线图中可以看出，受影响做决策与疾病传输的区别：

在病毒式营销中的扩散

交友网的例子：朋友在一个圈子的概率是如何决定一个人是否加入某个圈子的？

来自为知笔记(Wiz)

posted @ 2020-02-06 23:21 梳下鱼阅读(1066) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部