分子标记多态性信息量(PIC)的计算?

PIC指的是一个标记用于在群体检测多态性的价值。在芯片开发中可作为一个重要指标。

计算一

PIC取决于检测的等位基因的数目和它们的频率分布。其值等于1减去所有等位基因频率的平方的总和。例如,一个微卫星标记的两个等位基因的PIC频率各为0.5,应为1-[(0.5)2 +(0.5)2]= 0.5,而两个等位基因频率是0.9和0.1的微卫星标记PIC为0.18。由此可见,等位基因数越大,PIC就越大;等位基因是一个特定数目,等位基因频率越平等,PIC的就越高。PIC值的比较可以给研究人员一个初步的结论,以解决各种标记类型的效率对遗传生物信息学具体问题的大致了解。

image.png

对于双等位基因(biallelic sites)而言,与MAF差不多,简单计算:

PIC = 1-(maf^2+(1-maf)^2)

计算二

image.png

PIC = 1- (maf^2+(1-maf)^2))-(2maf^2(1-maf)^2)

PICcalc: an online program to calculate polymorphic information content for molecular genetic studies

两种方法对于多态性评价差别不大,相对大小几乎是一致的。图简单用一即可。

参考:
https://www.researchgate.net/post/How_to_calculate_polymorphic_information_content_PIC_value_for_SNP_marker_data_manually_What_are_the_software_to_calculate_it#:~:text=When calculating the PIC%2C you first calculate heterozygosity%2C,which for an SNPs is just 2*maf^2* (1-maf)^2.
https://baike.baidu.com/item/pic/6322826
https://helda.helsinki.fi/bitstream/handle/10138/42438/PICcalc_2012_BIGI.pdf?sequence=2
https://www.docin.com/p-580493979.html#:~:text=PIC是指一个标记依靠其可检测的等位基因数和它们的分布频率%2C从而得到该标记在一个群体中检测的多态性大小值。,PIC值按照Anderson的方法计算%2C对于标记i的PIC值计算公式为%3A其中%3APij表示标记i个带型出现的频率%2C标记i的总带型从1到n。

posted @ 2022-11-10 17:00  生物信息与育种  阅读(1943)  评论(0编辑  收藏  举报