摘要:
这些数据表现出显著的长尾分布,凸显了推断特定蛋白质功能的挑战,尤其是那些罕见功能的蛋白质。在自然语言处理(NLP)的众多应用场景中,大型语言模型(Large Language Model, LLM)展现了其卓越的文本理解与生成能力,不仅在传统的文本任务上成绩斐然,更在生物学、计算化学、药物研发等跨学科领域证明了其广泛的应用潜力。Mol-Instructions数据集共计含2043K条指令数据,覆盖了小分子、蛋白质以及生物分子文本三大领域的17个关键任务,包含了不同复杂度和结构的生物分子及丰富的文本描述。 阅读全文
摘要:
我们生活在一个多模态的世界中。视觉的捕捉与理解,知识的学习与感知,语言的交流与表达,诸多方面的信息促进着我们对于世界的认知。作为多模态领域的一个典型场景,VQA旨在结合视觉的信息来回答所提出的问题。从15年首次被提出[1]至今,其涉及的方法从最开始的联合编码,到双线性融合,注意力机制,组合模型, 阅读全文
摘要:
参加了中南,北理工,南大,北航,浙大的j计算机夏令营。普通211信息安全专业,专业排名2%,非ACM队,因为喜欢编程参加过一些校赛。国奖等奖学金+3年优秀共青团员。有数学建模,CCF,软件设计师,大英竞赛等等。无论文。有一个国家级大创项目【NLP与信安交叉】,后来参加了一个国家级比赛在8月拿到全国二等奖。保研拉开序幕,上个月有过和一个CV方向的北航老师进行网络面试。感觉很不好。我挺喜欢那位老师的研究方向,但是可能是因为第一次面试经验不足,加上自己的工作展示ppt与老师所期望大相径庭。 阅读全文