达摩院智算与计算
达摩院智算与计算
视觉技术
致力于多模态视觉信号的理解与生成技术的研究,当前的重点研究方向包括更加精准的图像/视频/3D内容生成、更加可控的图像/视频/3D内容编辑、更加高效的生成框架、多模态的检索增强生成、统一的多模态理解-生成框架等。团队内部有完整的产品-算法-工程链路,技术深度和产业落地并重,支持阿里巴巴内外多项业务,在电商、遥感、新零售等多个领域有成功落地。
语言技术
致力于多语言大模型和语言模型驱动的多模态智能研究。希望突破制约大模型广泛应用的瓶颈,如可靠性、安全性、扩展性、经济性等,并对Agent、检索增强等核心技术进行探索。重点打造大模型多语言能力,比如针对东南亚、南亚等区域的语种,进行能力增强、更好的本地化,并着力解决多样化的安全性问题。同时,探索多语言多模态内容理解和生成的统一框架。终极目标是推动多模态智能涌现,形成对现实世界多模态环境的理解、推理和预测能力。
决策智能
致力于决策智能系统需要的机器学习、数学建模、优化求解、 时序预测、因果分析、决策方案可解释性、决策推理大模型等技术的研究和创新,提升业务的运营效率和收益、减少运营成本。代表作是行业领先的MindOpt优化求解器、智能电力预测eForecaster、决策开发云平台。团队研发的技术广泛应用于电力系统仿真和优化、功率与负荷预测、内容推荐、资源调度、库存定价、运维监测、排产排程、营销决策、数据智能分析等场景。其中,在电力能源行业构建出“绿色能源AI”方案,与国家电网、南方电网等企业合作落地多个项目。
视频技术
探索最前沿的视频技术研发,包括视频编解码、生成AI视频、AI质量评估、VR/AR等多个技术领域。推动最新的国际国内视频标准制定,包括H.266/VVC、AVS3、ECM、VCM、生成AI视频及质量评估等,其科研成果在视频编解码、视频处理和视频质量评价等领域顶会顶刊发表数十篇论文,其知识产权转化为数百项国际发明专利。团队所开发的Ali266编解码方案在多届MSU大赛蝉联多项指标冠军,编解码技术落地优酷、视频云及支付宝等多个视频业务场景。
医疗AI
技术方向包括基于深度学习的医学图像分割、检测与分类、医学图像配准计算机视觉医学应用、医疗数据挖掘分析等。研究内容涉及多种高发肿瘤和重大慢性疾病以及神经性退化性疾病的AI智能筛查、精准诊断、治疗方案预后优化,病人跟踪随访等生命全流程的医疗人工智能技术和临床解决方案研发。在Nature Medicine, Nature Communications, Annals of Surgery, Radiology, Briefings Bioinform, Clinical Cancer Research, IEEE TMI, MedIA等顶级临床期刊和技术期刊上发表多篇有影响力的论文;截至目前,医疗AI产品已成功对接落地30家以上的国内外顶级医疗影像合作伙伴,构建智能医疗健康生态,落地医疗机构数达1000+家,近两年已经为全球2600+万病人次提供智能化医疗健康服务。
智慧育种
团队汇聚了人工智能、生物信息、计算生物学、统计学、育种科学等多学科人才,依托达摩院自身在大数据和人工智能上的优势,围绕生物育种核心问题如多组学预训练模型、全基因组选择、基因大数据计算加速等方面开展研究,依托阿里巴巴在云技术上的优势,确保育种平台、微生物平台的高效性、高智慧性、高安全性和稳定性。2021年,达摩院与中国农业科学院作物科学研究所达成合作,构建覆盖作物育种全链条、智能化的“智慧育种公共服务平台”,为加快培育作物新品种提供重要技术支撑。
计算技术
致力于计算、存储、互联方向的前沿性研究,探索从系统软硬件架构到芯片设计技术的全栈实现。以国家芯片战略需求为牵引,以开源RISC-V架构为核心,针对包括大语言模型、自动驾驶、隐私计算等新兴人工智能应用,采用自上而下基于应用驱动和自下而上基于新技术的研究方法,利用系统架构、计算机体系结构、芯片设计优化等领域的技术积累,探索下一代芯片关键技术,在计算资源优化、新计算体系方向等构建创新系统,推动芯片业和数字经济的发展。
RISC-V
持续深耕 RISC-V 技术研发及生态建设,陆续推出了一系列玄铁处理器,可满足高中低全系列性能需求。玄铁积极拥抱开源,坚持开放创新,已逐渐构建起以 RISC-V 为核心的生态体系,与生态伙伴协同推动 RISC-V 芯片、开发工具、操作系统、应用解决方案等不同层面的软硬一体化发展,是RISC-V 国际基金会董事会成员和全球 RISC-V 软件生态计划“RISE” 首批创始成员。玄铁正全力推进 RISC-V 软硬全栈技术多领域发展落地,加速实现智能时代的万物互联。
参考文献链接
https://damo.alibaba.com/research-areas?tab=0&language=zh