动物所piRNA的高精度预测算法研究获得突破
动物所piRNA的高精度预测算法研究获得突破
第二代测序技术又称作深度测序技术,应用到RNA上统称作RNA-seq或RNA测序,它已成为基因表达和转录组分析的重要手段。第二代转录组测序数据中含有大量不编码蛋白质的ncRNA序列,因为它们像宇宙中的暗物质一样难以识别和有重要功能,也被称为“基因组暗物质”。由于数据量巨大,保守性差,又有噪音干扰,这些“暗物质”的识别成为表观遗传学和调控网络研究的瓶颈。piRNA是数量最大的一类ncRNA,主要是通过与转座子的序列互补来控制转座子的表达,进而调控生殖和发育。由于不同物种的piRNA之间同源性很差,至今国际上还没有有效的识别方法。
中国科学院动物研究所康乐研究组的张屹等最近发表的题为A k-mer scheme to predict piRNA and characterize locust piRNA 的最新研究论文,解决了高精度预测生物体中数量最大的一类非编码RNA---piRNA的难题,论文发表在生物信息学权威期刊《生物信息学》(Bioinformatics,IF=4.926)上。
这篇文章中提出了一种基于k-mer串频率的Fisher判别式来预测piRNA的算法, 精度达90%以上,超过了哈佛大学B. Doron的61%的精度。利用该方法,他们成功地鉴定出飞蝗8万多条piRNA,预测飞蝗可能存在约13万条piRNA。进一步分析发现,这些piRNA在飞蝗群居型和散居型间存在巨大差异,这可能为解释飞蝗两型生殖力差异提供了重要的线索。
这个不依赖基因组数据来鉴定非模式生物piRNA的新方法具有重要的理论意义和广泛的应用价值。目前,在线软件piRNApredictor (http://59.79.168.90/piRNA/index.php,) 已被国外科研机构用于猪的piRNA研究中。
piRNA预测算法的突破为其它ncRNA的预测提供了重要的启示:不保守的ncRNA是可以预测的。由于该算法理论的普遍性,该方法不仅可以预测其它物种的piRNA,还可以通过变更训练集来预测其它种类的ncRNA。而且,在线软件给出的piRNA高精度预测结果,对表观遗传学、调控网络与piRNA功能的进一步研究有重要理论意义和应用价值。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
2009-12-15 用“精听”提高英语听力水平