思元370芯片系列芯片概述

思元370芯片系列芯片概述
基于7nm制程工艺,思元370是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。凭借寒武纪最新智能芯片架构MLUarch03,思元370实测性能表现更为优秀。思元370也是国内第一款公开发布支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。搭载MLU-Link™多芯互联技术,在分布式训练或推理任务中为多颗思元370芯片提供高效协同能力。全新升级的寒武纪基础软件平台,新增推理加速引擎MagicMind,实现训推一体,大幅提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。
核心优势

 

思元370系列板卡与业内主流GPU性能对比

 

了解寒武纪思元370智能加速卡

 

MLU370-S4/S8智能加速卡面向高密度云端推理

MLU370-S4/S8加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4/S8加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。

产品规格

 

硬件合作伙伴

 

MLU370-S4/S8智能加速卡面向高密度云端推理

MLU370-S4/S8加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4/S8加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。

产品规格

 

MLU370-X8 智能加速卡训推一体人工智能加速卡

MLU370-X8采用双芯思元370配置,为双槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)训练算力和256TOPS (INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度。基于双芯思元370打造的MLU370-X8整合了两倍于标准思元370加速卡的内存、编解码资源,同时MLU370-X8搭载MLU-Link多芯互联技术,每张加速卡可获得200GB/s的通讯吞吐性能,是PCIe 4.0带宽的3.1倍,支持单机八卡部署,可高效执行多芯多卡训练和分布式推理任务

产品规格

 

参考文献链接

https://cambricon.com/index.php?m=content&c=index&a=lists&catid=360

posted @   吴建明wujianming  阅读(409)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2023-03-17 小鹏汽车技术市场动态分析
2022-03-17 存算一体AI芯片
2022-03-17 TensorRT-8量化分析
2021-03-17 台积电5nm光刻技术
2020-03-17 CVPR2020论文点评: AdderNet(加法网络)
2020-03-17 3D-camera结构光原理
点击右上角即可分享
微信分享提示