首个种业大语言模型“丰登”(SeedLLM)

昨天被首个种业大语言模型“丰登”刷屏,崖州湾实验室、中农、上海AI实验室三家单位共同发布,官方报道侧重各有不同,这里放到一起看看。没测试,不做评价。

崖州湾实验室发布

4月28日,崖州湾国家实验室精准设计与智造团队,中国农业大学和上海人工智能实验室共同发布了首个种业大语言模型“丰登” ,英文名称Large Language Model for Seed Design (SeedLLM)。该模型集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,对海量来自不同渠道的育种科研文献、技术书籍及网络资源进行深度解析和索引,在品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询等四大应用场景中,为用户提供解释和回答。“丰登”模型在由国内育种专家制定的标准测评中表现远超农学相关专业本科生,综合得分是本科生的4.87倍。

该模型具有4大核心能力:

  • 整合分散的知识资源:系统深度挖掘并结构化我国在育种领域迄今积累的包括学术文献、书籍、田间日志在内的广泛知识。

  • 跨领域知识融合:利用多学科知识图谱,整合了生物学、遗传学、气象学、土壤学等相关领域的知识,发掘这些领域之间的新联系。

  • 提高访问效率:通过自然语言对话接口降低了技术门槛,用户可以直接提出问题并迅速获得易于理解的答案,提高育种工作效率。

  • 知识共享与传播:不仅服务于育种专家和科研人员,也向全国的农业工作者提供必要的支持,加速了育种知识的广泛传播和应用。

为全面评估“丰登”的专业性能,实验室精准设计与智造团队、中国农业大学和上海人工智能实验室,组织育种专家设计了100道水稻育种专业问题及对应标准答案,涵盖品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询四大任务。共计115人参与本次标准测评,其中包括14名国内水稻育种专家,49名农学相关专业研究生和52名本科生(大三及以上)。评估团队通过排序和打分的方法,对“丰登”的回答在准确性、稳定性和推理能力等方面进行了细致评价。测评中还引入了本科生的回答作为测试基准。该测评结果表明,“丰登”在最佳答案个数和综合分数上的表现均超出预期,且在多个评估维度上超越了语言模型国际领先水平代表Anthropic Claude3和OpenAI GPT-4。这些结果充分证明了“丰登”种业大语言模型在处理水稻育种相关知识方面的潜力。

“丰登”v0.1拥有200亿参数,现已开放水稻相关知识的测试接口申请。首批参与测试的单位除崖州湾国家实验室和中国农业大学外,还包括隆平高科、中国科学院、中国农业科学院、正大集团、复旦大学、华中农业大学、华南农业大学、上海市农业科学院、广东省农业科学院等。我们诚邀国内育种领域各单位参与研发,提供高质量语料,涵盖更多品种,助力中国种业。

附1:对照模型介绍

  • GPT-4: 美国OpenAI公司开发的多模态语言模型,能够生成高质量的文本,并在数据分析、艺术创作等多领域表现出色,被广泛认为是目前全球最先进的语言处理工具。

  • Claude3: OpenAI 最大竞争对手Anthropic开发的人工智能语言模型,通过Constitutional AI技术减少误导性内容,提升了用户交互质量。

中国农大发布

4月28日,中国农业大学深圳研究院王喜庆教授团队携手上海人工智能实验室和崖州湾国家实验室,共同发布了“丰登”(SeedLLM)首个种业专用大语言模型。通过深度挖掘我国已有的科研文献、科技专著、种业企业报告及历史推广数据,“丰登”能够以用户友好的方式,解答关于作物品种选育、推广、栽培技艺及种业市场动态等各类问题。

“丰登”大模型的推出,不仅填补了国内种业领域大模型的空白,更标志着我国在育种技术上的一次勇敢的创新尝试。

自2022年起,中国农业大学深圳研究院就与华为公司携手,共同推进智慧育种项目。该项目以生物技术与信息通信技术的深度融合为核心,旨在全面提升育种全流程效率,积极探索育种表型机器人与智慧育种大模型研发。

在深圳市科技创新委的大力支持下,王喜庆教授团队已成功研发出一款具有观察能力的机器人。而“丰登”大模型和“良种佳缘”AI模型(品种定位算法)的引入,将进一步推动这款机器人向具备思考与决策能力的智慧育种系统平台升级。

过去十余年间,王喜庆教授团队充分利用中国农业大学作物功能基因组与分子育种研究中心平台,在东北、黄淮海试验基地、三亚南繁基地深入挖掘矮杆密植玉米新基因。同时,该项工作得到了地方政府的大力支持:在新疆阿克苏地区、宁夏银川建立了抗旱、耐盐碱种业研究基地;在重庆开展牧草智慧育种研究,高效发掘抗逆优异基因资源与新种质。

经过多年不懈努力,团队已成功构建了一条以北京生物育种、深圳智慧育种为主导,覆盖全国作物和牧草主产区的科技创新链。这一创新链将推动定向育种、精准育种和加速育种的发展,进而形成集机器人技术、先进算法和专业服务于一体的综合模式,助力种业科技突破和产业持续发展。

上海AI实验室发布

4月28日,上海人工智能实验室(上海AI实验室)联合崖州湾国家实验室和中国农业大学发布首个种业大语言模型丰登(SeedLLM)。在上海AI实验室研发的大语言模型书生·浦语2.0的基础上,科研人员通过注入科技文献、产业实践报告等海量专业数据,训练出具备强大理解和分析能力的种业大模型。

同时,联合团队还推出首个种业大语言模型评测基准,通过汇集育种专家整理的专业育种问题与最新评测技术,提供客观性能量化参考,促进“人工智能+农业”生态繁荣。

丰登现已开放水稻领域相关知识测试接口申请,欢迎种业产学研机构试用并参与研发。详情垂询OpenScienceLab@pjlab.org.cn。

破解学习实践壁垒,改变科学育种范式

上海AI实验室联合团队创新性地提出了大模型赋能生物育种的思路,把丰登训练成初具“AI研究员”潜力的大模型,它可通过自主学习,发掘生物、遗传、气象及土壤间的复杂关联,形成新的知识结构。目前,丰登已具有品种选育、农艺性状、栽培技术和推广区域等四大核心领域的解释和回答能力,具备以下性能特征:

  • 整合分散知识资源。相较于国内外主流大语言模型,丰登专注于生物育种。育种领域当前涉及的知识资源包括学术文献、田间日志及政府公示等呈现分散状态。科研人员对相关知识进行了深度挖掘,将文本信息中提炼出的知识通过大模型的技术手段汇聚到模型权重中,再将分散在不同文献中的同一知识点进行了整合归纳,最终使育种专业知识以结构化的方式呈现。
  • 融合跨领域知识。基于书生·浦语2.0强大的基座模型能力,科研人员不仅对丰登进行了作物学、农学和遗传学等育种专业学科的知识训练,还整合了生物学、遗传学、气象学、土壤学等相关领域的多学科知识。通过提示词的合理运用,丰登可对相关领域之间的知识做到“融会贯通”。
  • 提高应用效率。丰登使用了自然语言对话接口,降低了使用门槛,用户可直接提出问题并迅速获得易于理解的信息。相较于传统的文献数据库查询和网络搜索,多轮对话的方式确保了信息的实时性和高效获取。丰登未来还可实现语音输入,进一步降低使用门槛。优异的对话体验和易用性,使丰登有望成为一线农业工作者贴身的“田间助手”,助力提升生物育种的工作效率,并加速育种知识的共享与传播。

丰登不仅能成为农民生产流程中的智能助手,还可为专业院校提供教学辅助工具,助力培养农业人才,更可为育种企业和科研院所提供智能化育种建议,进而为主管部门及相关机构提供基于种业大数据的政策建议。未来,丰登还会在大语言模型的基础上引入图像分析、多组学分析和决策育种能力,针对育种工作场景,进一步提升使用效率。

构建专业评测基准,直面实际应用需求

为了全面评估大模型在科学育种工作中的性能效用,上海AI实验室联合崖州湾国家实验室和中国农业大学共同组织了国际首个种业领域的标准化人工评估评测。组织育种专家制定了大量水稻育种专业问题及对应标准答案,涵盖品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询四大任务。同时,以此构建首个种业大语言模型评测基准,为AI兴农研究提供客观能力参考。

标准化人工评估团队由14名水稻育种专家、101名育种相关专业学生(49名研究生、52名本科生)组成。通过打分和排序,评估团队对包括丰登在内的多个主流大模型的回答进行了细致评价,涵盖回答准确性、稳定性和推理能力等维度。

评估中还引入了参与测试的学生的真实回答作为对照。评估结果显示,丰登在最佳答案个数和综合分数上的表现均超出预期,超越当前公认的高性能大模型Claude 3和GPT-4,其综合得分为相关专业本科生的4.87倍。

丰登的回答共计2386次获选为最佳答案;专家打分环节中,丰登成绩明显优于其他模型和真人受测者。

目前,隆平高科、正大集团、中国科学院、中国农业科学院、上海市农业科学院、广东省农业科学院、华中农业大学、华南农业大学、复旦大学等机构已加入丰登测试,大模型助力科学育种正在真实的应用场景下得到验证并优化。针对作为我国主要粮食作物之一的水稻,其通过国内各级农业部门认定的品种已超2万个。丰登现已率先开放水稻领域知识测试接口,诚邀国内育种领域机构参与研发测试,共同探索AI兴农创新路径。

posted @ 2024-06-16 11:02  生物信息与育种  阅读(21)  评论(0编辑  收藏  举报