UniRef90数据库和UniRef50数据库的区别

UniRef数据库是UniProt（Universal Protein Resource）提供的一系列非冗余蛋白质序列数据库，主要包括UniRef100、UniRef90和UniRef50。它们通过聚类算法将序列相似的蛋白质聚集在一起，减少数据冗余。UniRef90和UniRef50的区别主要在于聚类的相似性阈值。

UniRef90

聚类标准：在90%的序列相似性（identity）和80%的序列覆盖率（coverage）阈值下进行聚类。
特点：
- 将相似度大于或等于90%的序列聚类到一起，减少数据冗余，同时保留较高的序列多样性。
- 适合需要较高分辨率的分析，如功能注释和进化分析。

UniRef50

聚类标准：在50%的序列相似性（identity）和80%的序列覆盖率（coverage）阈值下进行聚类。
特点：
- 将相似度大于或等于50%的序列聚类到一起，大幅减少数据冗余，但同时也降低了序列的多样性。
- 适合大规模数据分析和资源受限的计算任务。

使用场景

UniRef90：在需要保留更多序列信息的情况下使用，如功能注释、进化分析和需要较高分辨率的蛋白质研究。
UniRef50：在需要减少数据规模、提高计算效率的情况下使用，如大规模的蛋白质数据库搜索和快速相似性分析。

总结

UniRef90聚类在90%的序列相似性阈值下，保留了更多的序列多样性，适合需要高分辨率的分析。
UniRef50聚类在50%的序列相似性阈值下，减少了更多的数据冗余，适合大规模数据处理和快速分析。

posted @ 2024-05-21 16:43 王哲MGG_AI 阅读(740) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· GO、KO、EGGNOG、RXN、PFAM和Level4EC

· microtable包的数据准备

· 微生物生态研究中常用数据库简介--转载

· BGI-College生信入门系列——3、数据库

· AlphaPulldown | in silico co-IP | 蛋白质相互作用预测 | 人工智能 | alphafold

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· .NET10 - 预览版1新功能体验（一）

公告

昵称：王哲MGG_AI
园龄： 1年10个月
粉丝： 143
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类 (324)

随笔档案 (324)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:相对丰度与绝对丰度
请问在ASV表里看到的是总拷贝数吗，计算物种的相对丰度是不是还要在除以每个物种的拷贝数？得到归一化之后的表格
--花落时相遇2999
2. Re:判定贝叶斯线性回归回归系数是否显著的标准
@王哲MGG_AI 谢谢作者。我目前遇到的问题是，需要比较三个贝叶斯模型的性能优劣。获取的回归系数有近一半不满足“回归系数的 95% 可信区间不包含零”的要求，但是R2为0.61。请问这种情况如何解决...
--jljl123
3. Re:判定贝叶斯线性回归回归系数是否显著的标准
@jljl123 整个贝叶斯模型...
--王哲MGG_AI
4. Re:判定贝叶斯线性回归回归系数是否显著的标准
求教作者，请问显著性水平（significance level）是仅针对回归系数而言的一个评判标准，还是能针对整个贝叶斯模型
--jljl123
5. Re:R：Wilcoxon秩和检验，比较两组样本中的基因表达差异
您好，table.l5.relative-SE.txt和group.txt的示例文件可以分享吗
--ff1996

AI FOR CODE 大赛