生命组学
蛋白质之间的互作可以有以下应用:
Eg:改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。
Eg:数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的dataset,用于制药
结构预测:
通用方法:首先将得到序列采用Fasta(全局序列比对)&blast(局部序列比对)在PDB中(此数据库中有实验数据和计算预测得到的数据)找模板modeling。找模板的方法可以基于sequence similarity。可以基于structure相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法quality高。可以基于研究目的(ligands and cofactors)。对于alignment方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确,pair模板序列比对结果具有高相似度,可用于保守区验证。model building方法:1.满足钢铁模型直接把保守区域的copy到给未知序列。2.方法一对于序列要求很高,必有没能连上的部分,没连上部分fragment assembly,这样得到的结构与膜件相似度高3.通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于assembly的software有insight QUANTA和SYBYL COMPOSER,这两个软件是图形界面且收费。也可使用MODELLER编译。在线分析软件有SWISS_MODEL、WHAT IF、3D-JIGSAW、CPH-Model。
普通方法用于水环境,Membrane protein溶液环境。
实验测困难,所以采用bioinformation的方法预测结构,特殊之处在于modeling Membrane protein structure模板是GPCRs(有螺旋),主要预测蛋白质形态,所处位置和胞内胞外结构,再将三者组合成初始结构,然后进一步优化旋转方向。
功能预测基于已解析的功能信息,有以下五种原理:
1.可使用自动化脚本在数据库中找sequence similarity,利用experiment判据选择。
2.因为结构比序列更保守,所以可采用structure-based。利用结构相似性找对应序列,分解出序列特征,通过序列相似性找相似性功能SCOP。其中,不同层级准确性不同:class <fold <superfamily <family
3.可通过预测结合腔的大小、形状、理化性质,从而得到功能域信息,有功能域就有功能
4.以motif-based为基本单位预测,选择可用功能,之后做进化树判断选择近源功能。
5.从System level角度来说,在KEGG pathway找到通路中的功能。
蛋白质之间互作网络便是PPI网络,它有两种类型:1.几种蛋白质参与同一个生物学过程,这是间接互作。2.几种蛋白质组成同一个复合物,这是直接接触而互作(eg:蛋白质复合物;四级结构)共同作用结果是行使功能。
研究互作方法:
- Phylogenetic profile method:某些基因经常同时存在,则认为这些基因对应蛋白质互作。
- Gene neighborhood:基因相对位置保守,则认为这些蛋白质互作。
- 物种A中两个功能域在同一个蛋白上,物种B中转变为两个蛋白质,则认为这两个蛋白质互作。这是因为真核生物中的调控更复杂,需要更多原件,所以有些功能域分化出来,基因组变大。
- 基因共进化:因为基因组系统发育树相近所以有可能蛋白质拓扑关系一致(eg1:一个带正电一个带负电。Eg2:金属A与金属B互作,A变则B也变),可以用跨物种比对拓扑关系,比对可用打分矩阵,最后用相关系数来判断,若等于1则说明有互作。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架