易混淆亲缘关系统计量(血缘系数、亲缘系数、近交系数)介绍

背景#

血缘系数、亲缘系数、近交系数等表征亲缘关系的统计量,在遗传学中经常使用。然而,这些概念很容易混淆。下面是几个概念的区别。注意的是,这些名词大多由英文翻译而来,而不同地方的中文翻译可能会有所差异,以英文名词为准。

介绍之前简单说一下同源性(Identity by Descent, IBD)的概念,它指两个等位基因来源于同一祖先。

image

Kinship coefficient / Coefficient of kinship#

血缘系数的定义#

血缘系数/近亲系数(Coefficient of Kinship,简称 ϕ )是遗传学中的一个重要概念,表示两个个体之间共享等位基因的概率。具体来说,它表示从两个个体中随机选择的两个等位基因在一个基因座上同源(即从共同祖先继承)的概率(Probability that an allele at a locus for two individuals was inherited from the same genome)。

血缘系数的计算#

血缘系数的计算涉及到追踪两个个体的家谱,并根据他们的共同祖先的数量和每代的遗传贡献来估算。例如,兄弟姐妹之间的系谱系数为0.25,因为他们有50%的概率从同一对父母继承相同的等位基因,而每个父母贡献了50%的遗传物质。

血缘系数 ϕXY 可以通过以下公式计算:

ϕXY=(0.5)n1+n2

其中 n1n2 分别是从共同祖先到个体 XY 的代数。

常见亲属关系的血缘系数#

以下是一些常见亲属关系的亲属系数:

  • 自我ϕ=0.5(每个人与自己共享50%的等位基因)
  • 父母与子女ϕ=0.25(父母与子女共享25%的等位基因)
  • 全同胞(兄弟姐妹)ϕ=0.25(兄弟姐妹共享25%的等位基因,因为他们有50%的概率从同一对父母继承相同的等位基因。)
  • 半同胞(同母异父或同父异母的兄弟姐妹)ϕ=0.125(半同胞共享12.5%的等位基因)
  • 祖父母与孙子女ϕ=0.125(祖父母与孙子女共享12.5%的等位基因)
  • 叔侄、姨甥关系ϕ=0.125
  • 堂表亲(第一代表亲)ϕ=0.0625(堂表亲共享6.25%的等位基因)

Coefficient of relationship / coefficient of relatedness#

亲缘系数的定义#

亲缘系数(Coefficient of Relationship,简称 r)是指两个个体之间的遗传关系程度。它表示两个个体共享的基因的比例,通常用百分比或小数表示。亲缘系数是遗传学中的一个重要概念,用于估计亲属之间共享等位基因的概率。亲缘系数由 Sewall Wright 定义。亲缘系数数值上是血缘系数 ϕ 的两倍。

亲缘系数的计算方法#

亲缘系数基于家谱信息,可以通过追溯共同祖先来计算。假设两个个体 XY 通过多个路径可以追溯到他们的共同祖先,那么可以通过以下步骤计算他们的亲缘系数:

  1. 确定所有共同祖先
  2. 计算每条路径的概率。对于每条路径,通过各代分支处的传递概率(每代为0.5)计算。
  3. 将所有路径的概率相加

公式表示如下:

rXY=(0.5)n

其中,n 是从共同祖先到 XY 的路径中间的代数。

常见亲属关系的亲缘系数#

以下是一些常见亲属关系的亲缘系数:

  • 自我r=1(每个人与自己共享100%的基因)
  • 父母与子女r=0.5(父母与子女共享50%的基因)
  • 全同胞(兄弟姐妹)r=0.5(兄弟姐妹共享50%的基因)
  • 半同胞(同母异父或同父异母的兄弟姐妹)r=0.25(半同胞共享25%的基因)
  • 祖父母与孙子女r=0.25(祖父母与孙子女共享25%的基因)
  • 叔侄、姨甥关系r=0.25
  • 堂表亲(第一代表亲)r=0.125(堂表亲共享12.5%的基因)

Coefficient of inbreeding#

近交系数的定义#

近交系数(Coefficient of Inbreeding,简称 F )是衡量一个个体在某基因座位上从父母双方继承的等位基因是同源(即从共同祖先继承)的概率。简单来说,近交系数表示个体的父母是否有血缘关系及其程度,反映的是近亲交配的程度。 近交系数由 Sewall Wright 最早定义,有时也称为固定系数 Fixation index。

近交系数的计算#

近交系数 F 的计算通常涉及家族谱系图,并且需要知道个体的祖先及其关系。以下是计算近交系数的一般步骤:

  1. 识别共同祖先:确定个体的共同祖先(即个体的父母双方都从这些祖先继承了基因)。
  2. 确定路径:找到从共同祖先通过父母到个体的所有可能路径。
  3. 计算每条路径的概率:对于每条路径,从共同祖先到个体的每一步都有 50% 的概率传递一个等位基因。
  4. 累加所有路径的概率:将所有路径的概率累加起来。

对于一个个体来说,假设 A 是父母 XY 的共同祖先,近交系数 F 可以通过以下公式计算:

F=A12n1+n2+1(1+FA)

其中:

  • n1 是从共同祖先 A 到个体 X 的代数。
  • n2 是从共同祖先 A 到个体 Y 的代数。
  • FA 是共同祖先 A 的近交系数。如果 A 是非近交个体,FA=0

具体例子#

假设一个个体 Z 的父母 XY 是全同胞(兄弟姐妹),那么个体 Z 的近交系数 FZ 的计算如下:

  1. 识别共同祖先:假设 XY 的共同祖先是 AB
  2. 确定路径:从 AXY,以及从 BXY 的路径。
  3. 计算每条路径的概率:每条路径有两代(从 AX,从 AY),所以 (0.5)2+2+1=(0.5)5=0.03125
  4. 累加所有路径的概率:有两条路径(通过 A 和通过 B),所以 2×0.03125=0.0625

因此,个体 Z 的近交系数 FZ=0.0625

常见的近交系数#

  • 自我F=1(完全同质化)
  • 父母与子女F=0.5
  • 全同胞(兄弟姐妹)F=0.25
  • 半同胞(同母异父或同父异母的兄弟姐妹)F=0.125
  • 叔侄、姨甥关系F=0.125
  • 堂表亲(第一代表亲)F=0.0625

换算#

对于个体 rj,同一亲属关系的亲缘系数 rij 数值上是血缘系数 ϕ 的两倍。

亲缘系数 rij 与近交系数 FiFj 的换算关系为:

rij=2Fij1+Fi1+Fj

对于二倍体生物:

血缘系数 ϕ 近交系数 F 亲缘系数 r 亲属关系例子
1/2 1/2 1 同卵双胞胎、克隆体、自交
1/4
1/4 1/2 父母和孩子
1/4
1/4 1/2 亲兄弟姐妹
1/8 1/8 1/4 同母异父或同父异母的兄弟姐妹
1/8 1/8 1/4 祖父母和孙
1/8 1/8 1/4 叔/舅和侄女、姑/姨和侄子
1/16 1/16 1/8 曾祖父母和曾孙
1/16 1/16 1/8 伯/叔祖父和大侄、伯/叔祖母和大甥
1/16 1/16 1/8 表/堂兄弟姐妹
1/32 1/32 1/16 高祖父母和玄孙
1/32 1/32
1/16 父母的表/堂兄弟姐妹
1/64 1/64 1/32
从表兄弟姐妹
~0 ~0 ~0 陌生人

注意:

  1. 表中列出的近交系数 F 为对应亲属关系近交后子代的近交系数。
  2. 在给定的例子中,血缘系数 ϕ 与 近交系数 F 数值相等,但含义不一样。以母子关系为例,母 i 和子 j 的血缘系数 ϕij 为 1/4。表中列出的近交系数 F 在这里的值为虽然也为1/4,但其表达的意思是如果个体 i 与 亲属 j 近交后,子代随机一个基因座的两个等位基因同源的概率为 1/4。

参考资料#

作者:shiyanhe

出处:https://www.cnblogs.com/shiyanhe/p/18320765

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

文章同步发布在本人公众号和shiyanhe.com,敬请关注。

posted @   实验盒  阅读(1243)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
more_horiz
keyboard_arrow_up dark_mode palette
选择主题
menu
点击右上角即可分享
微信分享提示